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UTILISATION DES PROTEINES ET DES PEPTIDES CODES PAR LE 
GENOME D'UNE NOUVELLE SOUCHE CORONAVIRUS ASSOCIE AU 

SRAS 

La presente invention est relative k une nouvelle souche de corona- 
5 virus associe au syndrome respiratoire aigu severe (SRAS), issue d'un preldvement 
r^pertorte sous le n° 031589 et pr£leve k Hanoi (Vietnam), a des molecules decide 
nucl&que issues de son g&iome, aux proteines et peptides codes par lesdites 
molecules d'acide nucleique ainsi qu'& leurs applications, notamment en tant que reac- 
tifs de diagnostic et/ou comme vaccin. 

10 Le coronavirus est un virus k ARN monocatenaire, de polarity posi- 

tive, d'approximativement 30 kilobases qui se rSplique dans le cytoplasme des cellules 
h6tes ; l'extremite 5' du genome a une structure en coiffe et l'extremite 3' comporte 
une queue polyA. Ce virus est envelopp6 et comprend, k sa surface, des structures 
p^plomdriques d&iomm£es spicules. 

15 Le gSnome comprend les cadres ouverts de lecture ou ORF suivants, 

de son extr&mite 5 s vers son extremity 3' : ORF la et ORF lb correspondant aux 
prolines du complexe de transcription-replication, et ORF-S, ORF-E, ORF-M et 
ORF-N correspondant aux prolines structurales S, E, M et N. II comprend ggalement 
des ORFs correspondant a des proteines de fonction inconnue codSes par : la region 

20 situee entre PORF-S et l'ORF-E et chevauchant cette derniere, la region situee entre 
l'GRF-M et l'ORF-N, et la region incluse dans V ORF-N. 

La proteine S est une glycoprot&ne membranaire (200-220 kDa) qui 
se presente sous la forme de spicules ou "Spike" 6mergeant de la surface de 
Penveloppe virale. Elle est responsable de I'attachement du virus aux rdcepteurs de la 

25 cellule h6te et de Tinduction de la fusion de Tenveloppe virale avec la membrane 
cellulaire. 

La petite proline d'enveloppe (E) egalement denomm^e sM (small 
membrane) qui est une proteine trans-membranaire non glycosyl^e d' environ 10 kDa, 
est la prot&ne presente en plus faible quantite dans le virion. Elle joue un role moteur 
30 dans le processus de bourgeonnement des coronavirus qui se produit au niveau du 
compartiment interm&iiaire dans le r&iculum endoplasmique et 1'appareil de Golgi 
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La proteine M ou proline de matrice (25-30 kDa) est une glyco- 
protein membranaire plus abondante qui est integrie dans la particule virale par une 
interaction M/E, tandis que F incorporation de S dans les particules est dirigSe par une 
interaction S/M. Elle semble etre importante pour la maturation virale des coronavirus 
5 et pour la determination du site au niveau duquel les particules virales sont assem- 
blies. 

La proline N ou proteine de nucteocapside (45-50 kDa) qui est la 
plus conservee parmi les proteines structurales des coronavirus, est nicessaire pour 
encapsider TARN ginomique puis pour diriger son incorporation dans le virion. Cette 

10 proline est vraisemblablement egalement impliquSe dans la replication de TARN. 

Lorsqu'une cellule hote est infectee, le cadre de lecture (ORF) sitiite 
en 5' du gdnome viral est traduit en une polyproteine qui est clivee par les proteases 
virales et libere alors plusieurs prolines non-structurales telles que TARN- 
polynterase ARN dipendante (Rep) et l'ATPase helicase (Hel). Ces deux proteines 

15 sont impliqu6es dans la replication du genome viral ainsi que dans la generation de 
transcrits qui sont utilises dans la synthese des prolines virales. Les mecanismes par 
lesquels ces ARNms sub-genomiques sont produits, ne sont pas complement 
compris ; cependant des faits recents indiquent que les sequences de regulation de la 
transcription a Textremite 5' de chaque g£ne represented des signaux qui rdgulent la 

20 transcription discontinue des ARNms sub-g6nomiques. 

Les proteines de la membrane virale (proteines S 5 E et M) sont iris6- 
rees dans le compartiment intermediate, alors que TARN teplique (brin +) s'assemble 
avec la proteine N (nucteocapside). Ce complexe proteine-ARN s'associe ensuite avec 
la proteine M incluse dans les membranes du reticulum endoplasmique et les 

25 particules virales se forment lorsque le complexe de la nucteocapside bourgeonne dans 
ie reticulum endoplasmique. Le virus migre ensuite a travers le complexe du Golgi et 
iventuellement sort de la cellule, par exemple par exocytose. Le site de l'attachement 
du virus a la cellule hote se trouve au niveau de la proteine S, 

Les coronavirus sont responsables de 15 & 30 % des rhumes chez 

30 l'Homme et d'infections respiratoires ou digestives chez les animaux, notamment le 
chat (FIPV : Feline infectious peritonitis virus) 9 la volaille (IBV : Avian Infectious 
bronchitis virus), la souris (MHV : Mouse Hepatitis virus), le pore (TGEV : 
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Transmissible gastroenterititis virus, PEDV : Porcine Epidemic Diarrhea virus, 
PRCoV : Porcine Respiratory Coronavirus, HEV : Hemagglutinating encephalo- 
myelitis Virus) et les bovins (BcoV : Bovine coronavirus). 

En g£n£ral, chaque coronavirus n'affecte qu'une seule esp&ce ; chez 
5 les individus immunocompetents, Tinfection induit des anticorps 6ventuellement 
neutralisants et une immunity cellulaire, capables de d&ruire les cellules infectees. 

Une 6pid&nie de pneumonie atypique, denomm£e syndrome respi- 
ratoire aigu severe (SARS ou Severe acute respiratory syndrome, SRAS en fran9ais) 
s'est propagee dans differents pays (Vietnam, Hong-Kong, Singapour, Thailande et 
10 Canada) au cours du premier trimestre 2003, & partir d'un foyer initial apparu en 
Chine dans le dernier trimestre de 2002. La s6v6rit6 de cette maladie est telle que son 
taux de mortality est d'environ 3 k 6 %. La determination de l'agent causatif de cette 
maladie a 6te entreprise par de nombreux laboratoires, a travers le monde. 

En mars 2003, un nouveau coronavirus (S ARS-CoV, SARS virus ou 
15 virus SRAS, en fran9ais) a 6t6 isole, en association avec des cas de syndrome respi- 
ratoire aigu severe (T.G.KSIAZEK et al., The New England Journal of Medicine, 
2003, 348, 1319-1330 ; C. DROSTEN et al., The New England Journal of Medicine, 
2003, 348, 1967-1976 ; Peiris et al., Lancet, 2003, 361, 13 19-). 

Des sequences genomiques de ce nouveau coronavirus ont ainsi 6te 
20 obtenues, notamment celles de Tisolat Urbani (Genbank n° d'accds AY2741 19.3 et A. 
MARRA et al., Science, May 1, 2003, 300, 1399-1404) et de l'isolat de Toronto 
(Tor2, Genbank n° d'accks AY 278741 et A. ROTA et al., Science, 2003, 300, 1394- 
1399). 

L'organisation du genome est comparable k celle des autres corona- 
25 virus connus permettant ainsi de confirmer Pappartenance du SARS-CoV a la famille 
des Coronaviridae ; les cadres ouverts de lecture ORFla et lb et les cadres ouverts de 
lecture correspondant aux proteines S, E, M, et N, ainsi qu'& des prolines codees par : 
la region situee entre l'ORF-S et l'ORF-E (ORF3), la region situde entre l'ORF-S et 
TORF-E et chevauchant l'ORF-E (ORF4), la region situee entre TORF-M et l'ORF-N 
30 (ORF7 a ORF11) et la region correspondant a l'ORF-N (ORF13 et ORF14), ont 
notamment ete identifies. 
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Sept differences ont 6t6 mises en Evidence entre les sequences des 
isolate Tor2 et Urbani ; 3 correspondent a des mutations silencieuses (c/t en position 
16622 et a/g en position 19064 de l'ORFlb, t/c en position 24872 de l'ORF-S) et 4 
modifient la sequence en acides amines de respectivement : les proteines cod£es par 
5 TORFla (c/t en position 7919 correspondant k la mutation A/V), la proteine S (g/t en 
position 23220 correspondant & la mutation A/S), la proteine cod£e par 1' ORF3 (a/g en 
position 25298 correspondant a la mutation R/G) et de la proline M (t/c en position 
26857 correspondant a la mutation S/P). 

En outre, l'analyse phylogenetique montre que le SARS-CoV est 
10 eloign^ des autres coronavirus et qu'il est apparu, ni par mutation de coronavirus 
respiratoires humains, ni par recombinaison entre des coronavirus connus (pour une 
revue, voir Holmes, J.C.I., 2003, 111, 1605-1609). 

La mise en 6vidence et la prise en compte de nouveaux variants sont 
importantes pour la mise au point de reactifs de detection et de diagnostic du SRAS 
15 suffisamment sensibles et specifiques ainsi qu'a des compositions immunogenes aptes 
a proteger des populations contre des epid£mies de SRAS, 

Les Inventeurs ont maintenant mis en Evidence une autre souche de 
coronavirus associe au SRAS, qui se distingue des isolate Tor2 et Urbani. 

La presente invention a done pour objet, une souche isol6e ou puri- 
20 fiee de coronavirus humain associe au syndrome respiratoire aigu severe, caract6ris6e 
en ce que son gdnome presente sous la forme d'ADN compl&nentaire un codon s6rine 
en position 23220-23222 du gene de la proteine S ou un codon glycine en position 
25298-25300 du gdne de l'ORF3, et un codon alanine en position 7918-7920 de 
PORFla ou un codon serine en position 26857-26859 du gdne de la proline M, 
25 lesdites positions £tant indiquees en reference a la s6quence Genbanlc AY2741 19.3. 

Selon un mode de realisation avantageux de ladite souche, 
requivalent ADN de son g&iome presente ime sequence correspondant k la sequence 
SEQ ID NO : 1 ; cette souche de coronavirus est issue du pr61evement de lavage 
bronchoalveolaire d'un patient atteint de SRAS, r<§pertorie sous le n° 031589 et 
30 effectue a Phopital fra^ais de Hanoi (Vietnam). 
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Conformement a Pinvention, ladite sequence SEQ ID NO :1 est 
celle de Pacide d^soxyribonucleique correspondant & la molecule d'acide ribo- 
nucl&que du genome de la souche isotee de coronavirus telle que definie ci-dessus. 

La sequence SEQ ID NO : 1 se distingue de la sequence Genbank 
5 AY2741 193 (isolat Tor2) en ce qu'elle possede les mutations suivantes : 

- g/t en position 23220 ; le codon alanine (get) en position 577 de la 
sequence en acides amines de la proteine S de Tor2 est remplac6 par un codon serine 
(tot), 

- a/g en position 25298 ; le codon arginine (aga) en position 11 de la 
10 sequence en acide amines de la proline codee par PORF3 de Tor 2 est remplac6 par 

un codon glycine (gga). 

En outre, la sequence SEQ ID NO : 1 se distingue de la sequence 
Genbank AY278741 (isolat Urbani) en ce qu'elle possede les mutations suivantes : 

- t/c en position 7919 ; le codon valine (gtt) en position 2552 de la 
15 sequence en acides amines de la proline codee par PORFla est remplace par un 

codon alanine (get), 

- t/c en position 16622 : cette mutation ne modifie pas la sequence 
en acides amines des proteines codees par PORFlb (mutation silencieuse), 

- g/a en position 19064 : cette mutation ne modifie pas la sequence 
20 en acides amin6s des proteines codees par PORFlb (mutation silencieuse), 

- c/t en position 24872 : cette mutation ne modifie pas la sequence 
en acides amines de la proteine S, et 

- c/t en position 26857 : le codon proline (ccc) en position 154 de la 
sequence en acides amines de la proline M est remplac^ par un codon serine (tec). 

25 En P absence de mention particuliere, les positions des sequences 

nucleotidiques et peptidiques sont indiquees en reference a la sequence Genbank 
AY274119.3. 

La pr^sente invention a 6galement pour objet un polynucleotide isole 
ou purifte, caract6ris6 en ce que sa sequence est celle du genome de la souche isol£e 
30 de coronavirus telle que definie ci-dessus. 

Selon un mode de realisation avantageux dudit polynucleotide il 
pr&sente la sequence SEQ ID NO : 1 . 
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La presente invention a 6galement pour objet un polynucleotide isole 
ou purifie, caract6ris6 en ce que sa sequence hybride dans des conditions de forte 
stringence avec la sequence du polynucleotide tel que defini ci-dessus. 

Les termes « isole ou purifie » signifient modifie « par la main de 
5 l'homme » §t partir de l'etat naturel ; autrement dit si un objet existe dans la nature, il 
est dit isote ou purifie s'il a 6t6 modifie ou extrait de son environnement naturel ou les 
deux. Par exemple, un polynucleotide ou une proteine/un peptide naturellement 
present dans un organisme vivant n'est ni isole, ni purifie ; en revanche le meme poly- 
nucleotide ou proline /peptide separ6 des molecules coexistantes dans son environ- 
10 nement naturel, obtenu par clonage, amplification et/ou synthese chimique est isole au 
sens de la presente invention. De plus, un polynucleotide ou une proteine/peptide qui 
est introduit dans un organisme par transformation, manipulation genetique ou par 
toute autre methode, est « isole » mdme s'il est present dans ledit organisme. Le terme 
purifie tel qu'utilise dans la presente invention, signifie que les proteines /peptides 
15 selon 1' invention sont essentiellement libres d' association avec les autres proteines ou 
polypeptides, comme Test par exemple le produit purifie de la culture de cellules 
hotes recombinantes ou le produit purifie a partir d'une source non-recombinante. 

Au sens de la presente invention, on entend par conditions ^hybri- 
dation de forte stringence, des conditions de temperature et de force ionique choisies 
20 de telle manure qu'elles permettent le maintien de Thybridation specifique et selective 
. entre polynucleotides compiementaires. 

A titre d'illustration, des conditions de forte stringence aux fins de 
definir les polynucleotides ci-dessus, sont avantageusement les suivantes : l'hybrida- 
tion ADN-ADN ou ADN-ARN est realisee en deux etapes : (1) prehybridation a 42°C 
25 pendant 3 heures en tampon phosphate (20 mM pH 7,5) contenant 5 x SSC (1 x SSC 
correspond a vine solution 0,15 M NaCl + 0, 015 M citrate de sodium), 50 % de 
formamide, 7 % de sodium dodecyl sulfate (SDS), 10 x Denhardt f s, 5 % de dextran 
sulfate et 1 % d'ADN de sperme de saumon ; (2) hybridation pendant 20 heures a 
42°C suivie de 2 lavages de 20 minutes a 20°C en 2 x SSC + 2 % SDS, 1 lavage de 20 
30 minutes a 20°C en 0,1 x SSC + 0,1 % SDS. Le dernier lavage est pratique en 0,1 x 
SSC + 0,1 % SDS pendant 30 minutes & 60°C. 

La presente invention a egalement pour objet un fragment represen- 
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tatif du polynucleotide tel que defini ci-dessus, caracteris6 en ce qu'il est susceptible 
d'etre obtenu, soit par Putilisation d'enzymes de restriction dont les sites de recon- 
naissance et de coupure sont presents dans ledit polynucleotide tel que defini ci- 
dessus, soit par amplification a Faide d' amorces oligonucleotidiques sp6cifiques dudit 
5 polynucleotide tel que defini ci-dessus, soit par transcription in vitro, soit par synthese 
chimique. 

Selon un mode de realisation avantageux dudit fragment, il est seiec- 
tionne dans le groupe constitue par : FADNc correspondant k au moins un cadre 
ouvert de lecture (ORF) choisi parmi : ORFla, ORFlb, ORF-S, ORF-E, ORF-M, 
10 ORF-N, ORF3, ORF4, ORF7 a ORF11, ORF13 et ORF14, et PADNc correspondant 
aux extremites 5' ou 3' non-codantes dudit polynucleotide. 

Selon une disposition avantageuse de ce mode de realisation, ledit 
fragment presente une sequence selectionnee dans le groupe constitue par : 

- les sequences SEQ ID NO : 2 et 4 representant FADNc corres- 
1 5 pondant a FORF-S qui code pour la proteine S, 

- les sequences SEQ ID NO : 13 et 15 representant TADNc corres- 
pondant a F ORF-E qui code pour la proteine E, 

- les sequences sequence SEQ ID NO: 16 et 18 representant 
FADNc correspondant a FORF-M qui code pour la proteine M, 

20 - les sequences SEQ ID NO : 36 et 38 representant FADNc corres- 

pondant a F ORF-N qui code pour la proteine N, 

- les sequences representant les ADNc correspondant respective- 
ment : aux ORFla et ORFlb (ORFlab, SEQ ID NO : 31), aux ORF3 et ORF4 (SEQ 
ID NO : 7, 8), aux ORF 7 d 11 (SEQ ID NO : 19, 20), a FORF13 (SEQ ID NO : 32) et 

25 k FORF14 (SEQ ID NO : 34), et 

- les sequences representant les ADNc correspondant respectivement 
aux extremites 5'(SEQ ID NO : 39 et 72) et 3' non-codantes (SEQ ID NO : 40, 73) 
dudit polynucleotide. 

La presente invention a egalement pour objet un fragment de 
30 FADNc codant pour la proteine S, tel que defini ci-dessus, caracterise en ce qu'il 
presente une sequence selectionnee dans le groupe constitue par les sequences SEQ ID 
NO : 5 et 6 (fragments Sa et Sb). 
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La presente invention a egalement pour objet un fragment de 
l'ADNc correspondant aux ORFla et ORFlb tel que defini ci-dessus, caracterise en ce 
qu'il presente une sequence selectionnee dans le groupe constitue par les sequences 
SEQ ID NO : 41 a 54 (fragments L0 a L12). 

5 La presente invention a egalement pour objet un fragment du poly- 

nucleotide tel que defini ci dessus, caract6rise en ce qu'il presente au moins 15 bases 
ou paires de bases consecutives de la sequence du genome de ladite souche incluant au 
moins une de celles situees en position 7979, 16622, 19064, 23220, 24872, 25298 et 
26857. De preference, il s'agit d'un fragment de 20 a 2500 bases ou paires de bases, 

1 0 de maniere preferee de 20 a 400. 

Selon un mode de realisation avantageux dudit fragment, il inclut au 
moins un couple de bases ou de paires de bases correspondant aux positions 
suivantes : 7919 et 23220, 7919 et 25298, 16622 et 23220, 19064 et 23220, 16622 et 
25298, 19064 et 25298, 23220 et 24872, 23220 et 26857, 24872 et 25298, 25298 et 

15 26857. 

La pr6sente invention a egalement pour objet des amorces d'au 
moins 18 bases aptes a amplifier un fragment du genome d'un coronavirus associe au 
SRAS ou de 1' equivalent ADN de celui-ci. 

Selon un mode de realisation desdites amorces, elles sont selection- 
20 n6es dans le groupe constitue par : 

- la paire d'amorces n° 1 correspondant respectivement aux positions 
28507 a 28522 (amorce sens, SEQ ID NO : 60) et 28774 a 28759 (amorce anti-sens, 
SEQ ID NO : 61) de la sequence du polynucleotide tel que defini ci-dessus, 

- la paire d'amorces n° 2 correspondant respectivement aux positions 
25 28375 a 28390 (amorce sens, SEQ ID NO : 62) et 28702 a 28687 (amorce anti-sens, 

SEQ ID NO : 63) de la sequence du polynucleotide tel que defini ci-dessus., et 

- la paire d'amorces constitute des amorces SEQ ID Nos 55 et 56. 
La presente invention a egalement pour objet une sonde apte a 

d&ecter la presence du genome d'un coronavirus associe au SRAS ou d'un fragment 
30 de celui-ci, caracterisee en ce qu'elle est selectionnee dans le groupe constitue par : les 
fragments tels que defrnis ci-dessus et les fragments correspondant aux positions 
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suivantes de la sequence du polynucleotide tel que defini ci-dessus : 28561 a 28586, 
28588 a 28608, 28541 a 28563 et 28565 k 28589 (SEQ ID NO : 64 k 67). 

Les sondes et amorces selon Tlnvention peuvent etre marquees 
directement ou indirectement par un compost radioactif ou non radioactif par des 
5 methodes bien connues de rHomme du Metier, afin d'obtenir un signal detectable 
et/ou quantifiable. Parmi les isotopes radioactifs utilises, on peut citer le 32 P, ie 33 P, le 
35 S, le 3 H ou 1 |125 I. Les entit6s non radioactives sont s61ectionnees parmi les ligands 
tels que la biotine, Tavidine, la streptavidine, la digoxyg£nine, les haptdnes, les colo- 
rants, les agents luminescents tels que les agents radioluminescents, chemolumines- 
10 cents, bioluminescents, fluorescents, phosphorescents. 

L' invention englobe les sondes et les amorces marquees dErivees des 
sequences precedentes. 

De telles sondes et amorces sont utiles pour le diagnostic de 
Pinfection par un coronavirus associe au SRAS. 

15 La pr£sente invention a egalement pour objet une methode de detec- 

tion d'un coronavirus assocte au SRAS, k partir d'un echantillon biologique, laquelle 
methode est caracteris^e en ce qu'elle comprend au moins : 

(a) 1 'extraction d'acides nucl&ques presents dans ledit Echantillon 

biologique, 

20 (b) Pamplification d'un fragment de l'ORF-N par RT-PCR a Paide 

d'une paire d'amorces telle que dgfinie ci-dessus, et 

(c) la detection par tout moyen appropriS des produits 
d' amplifications obtenus en (b). 

Les produits d' amplifications (amplicons) en (b) sont de 268 pb pour 
25 la paire d'amorces n° 1 et de 328 pb pour la paire d'amorces n°2. 

Selon un mode de mise en ceuvre avantageux dudit proc^de, Petape 
(b) de detection est realisde a Paide d'au moins une sonde correspondant aux positions 
28561 a 28586, 28588 k 28608, 28541 a 28563 et 28565 k 28589 de la sequence du 
polynucleotide tel que dSfini ci-dessus. 
30 De preference, le g&iome du coronavirus associe au SRAS est 

detects et gventuellement quantifie par PCR en temps r£el, k Paide de la paire 
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d'amorces n°2 et des sondes correspondant aux positions 28541 k 28563 et 28565 k 
28589 marquees avec des composes diff&rents, notamment des agents fluorescents 
differents. 

La RT-PCR en temps r6el qui met en oeuvre cette paire d' amorces et 
5 cette sonde est tres sensible puisqu'elle permet de detecter 10 2 copies d'ARN et jusqu'a 
10 copies d'ARN, elle est en outre fiable et reproductible. 

L'invention englobe les polydSsoxyribonucleotides et les polyribo- 
nucleotides simple-brin, double-brin et tripe-brin correspondant a la sequence du 
genome de la souche isotee de coronavirus et de ses fragments tels que definis ci- 
10 dessus, ainsi qu'& leurs sequences compl&nentaires, sens ou anti-sens, notamment les 
ARN et les ADNc correspondant a la sequence du genome et de ses fragments tels que 
definis ci-dessus. 

La pnSsente invention englobe ggalement les fragments 
d'amplification obtenus a Taide d'amorces specifiques du genome de la souche puri- 

15 fi6e ou isolee tel que defini ci-dessus, notamment a l'aide d'amorces et de paires 
d'amorces telles que d^finies ci-dessus, les fragments de restriction constitu6s par ou 
comprenant la sequence des fragments tels que definis ci-dessus, les fragments obte- 
nus par transcription in vitro a partir d'un vecteur contenant la sequence SEQ ID NO : 
1 ou un fragment tel que defini ci-dessus, ainsi que des fragments obtenus par 

20 synthase chimique. Des exemples de fragments de restriction sont deduits de la carte 
de restriction de la sequence SEQ ID NO : 1 illustrSe par la figure 13. Conform&nent 
k V invention lesdits fragments sont, soit sous forme de fragments isotes, soit sous 
forme de melanges de fragments. L'invention englobe 6galement les fragments modi- 
fies, par rapport aux precedents, par enlevement, ou addition de nucleotides dans une 

25 proportion d'environ 15 %, par rapport a la longueur des fragments ci-dessus et/ou 
modifies au niveau de la nature des nucleotides, des lors que les fragments nucteo- 
tidiques modifies conservent une capacity d'hybridation avec les sequences d'ARN 
g£nomiques ou antig&iomiques de l'isolat tel que defini ci-dessus. 

Les molecules d f acide nucleique selon invention sont obtenues par 

30 les methodes classiques, connues en elles-memes, en suivant les protocoles standards 
tels que ceux d£crits dans Current Protocols in Molecular Biology (Frederick M. 
AUSUBEL,2000, Wiley and son Inc, Library of Congress, USA). Par exemple, elles 
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peuvent Stre obtenues par amplification d'une sequence nucleique par PCR ou RT- 
PCR ou bien par synthese chimique totale ou partielle. 

La prSsente invention a egalement pour objet une puce ou filtre k 
ADN ou a ARN, caracterise en ce qu'il comprend au moins un polynucleotide ou Pun 
5 de ses fragments tels que definis ci-dessus. 

Les puces ou filtres k ADN ou a ARN selon 1'invention sont prepa- 
res par les methodes classiques, connues en elles-memes, comme par exemple 
greffage chimique ou electrochimique ^oligonucleotides sur support de verre ou de 
nylon. 

10 La pr^sente invention a egalement pour objet un vecteur de clonage 

et/ou d'expression recombinant, notamment un plasmide, un virus, un vecteur viral ou 
un phage comprenant un fragment d'acide nucleique tel que defini ci-dessus. De 
preference, ledit vecteur recombinant est un vecteur d'expression dans lequel ledit 
fragment d'acide nucleique est place sous le contrdle d'eiements regulateurs de la 

15 transcription et de la traduction appropries. En outre, ledit vecteur peut comprendre 
des sequences (etiquettes ou tag) fusionnees en phase avec l'extremite 5' et/ou 3 1 dudit 
insert, utiles pour rimmobilisation, et/ou la detection et/ou la purification de la 
proteine exprimee a partir dudit vecteur. 

Ces vecteurs sont construits et introduits dans des cellules hotes par 

20 les methodes classiques d'ADN recombinant et de genie genetique, qui sont connues 
en elles-memes. De nombreux vecteurs dans lesquels on peut inserer une molecule 
d'acide nucleique d'interet afin de Tintroduire et de la maintenir dans une cellule h6te, 
sont connus en eux-memes ; le choix d'un vecteur approprie depend de Putilisation 
envisagee pour ce vecteur (par exemple replication de la sequence d'interet, expres- 

25 sion de cette sequence, maintien de la sequence sous forme extrachromosomique ou 
bien integration dans le materiel chromosomique de Phdte), ainsi que de la nature de la 
cellule h6te. 

Conformement h I'invention, ledit plasmide est notamment seiec- 
tionne parmi les plasmides suivants : 
30 - le plasmide, denomme SARS-S, compris dans la souche bacte- 

rienne deposee sous le n° 1-3059, le 20 juin 2003, aupres de la Collection Nationale de 
Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 
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contient la sequence d'ADNc codant pour la proteine S de la souche de SARS-CoV 
issue du pretevement repertorie sous le n° 031589, laquelle sequence correspondant 
aux nucleotides des positions 21406 a 25348 (SEQ ID NO : 4), en reference k la 
sequence Genbank AY2741 19.3, 
5 - le plasmide, denomme SARS-S1, compris dans la souche bacte- 

rienne deposee sous le n° 1-3020, le 12 mai 2003, aupres de la Collection Nationale de 
Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 
contient un fragment 5' de la sequence d'ADNc codant pour la proteine S de la souche 
de SARS-CoV issue du prelevement repertorie sous le n° 031589, telle que definie ci- 

10 dessus, lequel fragment correspondant aux nucleotides des positions 21406 a 23454 
(SEQ ID NO :5), en reference k la sequence Genbank AY2741 19 .3 Tor2, 

- le plasmide, denomme SARS-S2, compris dans la souche bacte- 
rienne deposee sous le n° 1-3019, le 12 mai 2003, auprds de la Collection Nationale de 
Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 

15 contient un fragment 3'de la sequence d'ADNc codant pour la proteine S de la souche 
de SARS-CoV issue du prelevement repertorie sous le n° 03 1589, telle que definie ci- 
dessus, lequel fragment correspondant aux nucleotides des positions 23322 a 25348 
(SEQ ID NO :6), en reference a la sequence Genbank n° d'acces AY2741 19.3, 

- le plasmide, denomme SARS-SE, compris dans la souche bacte- 
20 rienne deposee sous le n° 1-3126, le, 13 novembre 2003, aupres de la Collection 

Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15; il contient l'ADNc correspondant a la region situee entre l'ORF-S et 
I'ORF-E et chevauchant l'ORF-E de la souche de SARS-CoV issue du prelevement 
repertorie sous le n° 031589, telle que definie ci-dessus, laquelle region correspondant 
25 aux nucleotides des positions 25110 a 26244 (SEQ ID NO :8), en reference a la 
sequence Genbank n° d'acces AY2741 19.3, 

- le plasmide, denomme SARS-E, compris dans la souche bacte- 
rienne deposee sous le n° 1-3046, le 28 mai 2003, aupres de la Collection Nationale de 
Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 

30 contient la sequence d'ADNc codant pour la proteine E de la souche de SARS-CoV 
issue du prelevement repertorie sous le n° 031589, telle que definie ci-dessus, laquelle 
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sequence correspondant aux nucleotides des positions 26082 a 26413 (SEQ ID 
NO :15), en reference a la sequence Genbank n° d'accfcs AY2741 19.3, 

- le plasmide, denomm^ SARS-M ; compris dans la souche bacte- 
rienne deposee sous le n° 1-3047, le 28 mai 2003, aupr£s de la Collection Nationale de 

5 Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 
contient la sequence d'ADNc codant pour la proline M de la souche de SARS-CoV 
issue du pretevement repertorie sous le n° 031589, telle que definie ci-dessus; 
laquelle sequence correspondant aux nucleotides des positions 26330 h 27098 (SEQ 
ID NO : 1 8), en reference a la sequence Genbank n° d'acces AY2741 1 9.3, 

10 - le plasmide d6nomme SARS-MN, compris dans la souche bacte- 

rienne deposee sous le n° 1-3125, le 13 novembre 2003, auprds de la Collection 
Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15 ; il contient la sequence d'ADNc correspondant a la region situee entre 
l'ORF-M et l'ORF-N de la souche de SARS-CoV issue du pavement repertorie 

15 sous le n° 031589 et pr^levee k Hanoi, telle que definie ci-dessus, laquelle sequence 
correspondant aux nucleotides des positions 26977 a 28218 (SEQ ID NO :20), en refe- 
rence a la sequence Genbank n° d'acces AY2741 19.3, 

- le plasmide denomm6 SARS-N, compris dans la souche bacte- 
rienne deposee sous le n° 1-3048, le 5 juin 2003, aupres de la Collection Nationale de 

20 Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il 
contient 1'ADNc codant pour la proline N de la souche de SARS-CoV issue du 
preievement repertorie sous le n° 031589, telle que definie ci-dessus, laquelle 
sequence correspondant aux nucleotides des positions 28054 k 29430 (SEQ ID 
NO :38), en reference k la sequence Genbank n° d'acces AY274119.3 ; ainsi ce 

25 plasmide comprend un insert de sequence SEQ ID NO :38 et est compris dans une 
souche bacterienne qui et qu'il a ete deposee sous le n° 1-3048, le 5 juin 2003, aupres 
de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 
75724 Paris Cedex 15, 

- le plasmide denomme SARS-5'NC, compris dans la souche bacte- 
30 rienne deposee sous le n° I- 3124, le 7 novembre 2003, aupr£s de la Collection 

Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15 ; il contient l'ADNc correspondant h Textremite 5'non codante du genome 
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de la souche de SARS-CoV issue du pr&evement rSpertoriS sous le n° 031589, telle 
que dSfinie ci-dessus, laquelle sequence correspondant aux nucleotides des positions 1 
a 204 (SEQ ID NO :39), en reference a la sequence Genbank n° d'acces AY2741 193, 

- le plasmide dfeomme SARS-3'NC, compris dans la souche bacte- 
5 rienne d6posee sous le n° 1-3123 le 7 novembre 2003, auprds de la Collection 

Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15. ; il contient la sequence d'ADNc correspondant a l'extremit6 3'non codante 
du genome de la souche de SARS-CoV issue du pretevement r6pertori6 sous le n° 
031589, telle que definie ci-dessus, laquelle sequence correspondant a celle situee 
10 entre le nucleotide en position 28933 k 29727 (SEQ ID NO :40), en reference a la 
sequence Genbank n° d'acces AY2741 19.3, se termine par une serie de nucleotides a., 

- le plasmide d'expression denomme pIV2.3N, contenant un 
fragment d'ADNc codant pour une fusion C-terminale de la proline N (SEQ ID NO : 
37) avec une etiquette polyhistidine, 

15 - le plasmide d'expression denomme pIV2.3Sc, contenant un 

fragment d'ADNc codant pour une fusion C-terminale du fragment correspondant aux 
positions 475 & 1 193 de la sequence en acides amines de la proteine S (SEQ ID NO : 
3) avec une etiquette polyhistidine, 

- le plasmide d'expression pIV2.3Sl, contenant un fragment 
20 d'ADNc codant pour une fusion C-terminale du fragment correspondant aux positions 

14 k 1 193 de la sequence en acides amin6s de la proteine S (SEQ ID NO : 3) avec une 
Etiquette polyhistidine, 

- le plasmide d'expression d6nomm6 pIV2.4N, contenant un 
fragment d'ADNc codant pour une fusion N-terminale de la proteine N (SEQ ID NO : 

25 3) avec une Etiquette polyhistidine, 

- le plasmide d'expression d&iommS pIV2.4Sc ou pIV2.4Si, conte- 
nant un insert codant pour une fusion N-terminale du fragment correspondant aux 
positions 475 a 1 193 de la sequence en acides amines de la proteine S (SEQ ID NO : 
3) avec une etiquette polyhistidine, et 

30 - le plasmide d'expression denomme pIV2.4Sl contenant un 

fragment d'ADNc codant pour une fusion N-terminale du fragment correspondant aux 



WO 2005/056781 



PCT/FR2004/003105 



15 

positions 14 a 1 193 de la sequence en acides amines de la proteine S (SEQ ID NO : 3) 
avec une Etiquette polyhistidine. 

Selon une disposition avantageuse du plasmide d'expression tel que 
defini ci-dessus, il est compris dans une souche bact6rienne qui a 6t6 d6pos6e sous le 
5 n° I- 3117, le 23 octobre 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15. 

Selon une autre disposition avantageuse du plasmide d'expression 
tel que defini ci-dessus, il est compris dans une souche bacterienne qui a et6 d6pos£e 
sous le n° I- 3118, le 23 octobre 2003, auprds de la Collection Nationale de Cultures 
10 de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15. 

Selon une autre disposition du plasmide d'expression tel que d6fini 
ci-dessus, il est compris dans une souche bact6rienne qui a 6t6 deposee a la CNCM, 25 
rue du Docteur Roux, 75724 Paris Cedex 15 sous les num6ros suivants : 
a) souche n° I- 3 1 1 8, deposee le 23 octobre 2003, 
15 b) souche n° I- 3019, d6pos6e le 12 mai 2003, 

c) souche n° I- 3020, deposee le 12 mai 2003, 

d) souche n°I-3059, deposee le 20 juin 2003, 

e) souche n° 1-3323, deposee le 22 novembre 2004, 

f) souche n° 1-3324, deposee le 22 novembre 2004, 
20 g) souche n° 1-3326, d6posee le l er decembre 2004, 

h) souche n° 1-3327, deposee le l er decembre 2004, 

i) souche n° 1-3332, deposee le l er decembre 2004, 
j) souche n° 1-3333, deposee le l er d6cembre 2004, 
k) souche n°I-3334, deposee le l er decembre 2004, 

25 1) souche n° 1-3335, d6pos6e le l er decembre 2004, 

m) souche n° 1-3336, d£pos<§e le l er decembre 2004, 

n) souche n° 1-3337, deposee le l er decembre 2004, 

o) souche n° 1-3338, deposee le 2 d6cembre 2004, 

p) souche n° 1-3339, deposee le 2 decembre 2004, 
30 q) souche n° 1-3340, deposee le 2 decembre 2004, 

r) souche n° 1-3341, deposee le 2 decembre 2004. 
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La presente invention a egalement pour objet un inserat d'acide 
nucleique d'origine virale, caracterise en ce qu'il est contenu dans Tune quelconque 
des souches telles que definies ci-dessus en a)-r). 

La presente invention a Egalement pour objet ton acide nucieique 
5 comportant un gene synthetique permettant une expression optimisee de la proline S 
dans des cellules eucaryotes, caracterise en ce qu'il possSde la sequence SEQ ID NO: 
140. 

La presente invention a egalement pour objet un vecteur 
d' expression comportant un acide nucieique comportant un gene synthetique permet- 
10 tant une expression optimisee de la proteine S, lequel vecteur est contenu dans la 
souche bacterienne deposee & la CNCM, le l er decembre 2004, sous le n°I-3333. 

Selon un mode de realisation dudit vecteur d'expression, il s'agit d'un 
vecteur viral, sous forme de particule virale ou sous forme de genome recombinant. 

Selon une disposition avantageuse de ce mode de realisation, il s'agit 
15 d'une particule virale recombinante ou d ! un genome viral recombinant susceptible 
d'etre obtenu par transfection d'un plasmide selon les alineas g), h) et k) a r) tels que 
definis ci-dessus, dans un systeme cellulaire approprie, c'est-&-dire, par exemple, des 
cellules transferees avec un ou plusieurs autres plasmide(s), destines a trancompie- 
menter certaines fonctions du virus deietees dans le vecteur et necessaires a la forma- 
20 tion des particules virales. 

On entend ici par « famille de la proteine S » la proteine S complete, 
son ectodomaine et des fragments de cet ectodomaine qui sont de preference produits 
dans un systeme eucaryote. 

La presente invention a egalement pour objet un vecteur lenti viral 
25 codant pour un polypeptide de la famille de la proteine S, telle que definie ci-dessus. 

La presente invention a egalement pour objet un virus rougeole 
recombinant codant pour un polypeptide de la famille de la proteine S, telle que 
definie ci-dessus. 

La presente invention a egalement pour objet un virus vaccine 
30 recombinant codant pour un polypeptide de la famille de la proteine S, telle que 
definie ci-dessus. 
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La pr£sente invention a egalement pour objet Putilisation d'un 
vecteur selon les alin£as e) k r) tels que definis ci-dessus, ou d'un vecteur comportant 
un g£ne synthetique de la proteine S, tel que defini ci-dessus, pour la production, en 
syst&ne eucaryote, de la proteine S du coronavirus associe au SRAS, ou d'un fragment 
5 de cette proteine. 

La presente invention a egalement pour objet une methode de 
production de la. proteine S en systeme eucaryote, comportant une etape de transfec- 
tion de cellules eucaryotes en culture par un vecteur choisi parmi les vecteurs contenus 
dans les souches bacteriennes mentionnees aux alineas e) k r) ci-dessus ou un vecteur 

10 comportant un g£ne synthetique permettant une expression optimis£e de la proteine S. 

La presente invention a egalement pour objet une banque d'ADNc 
caracterisee en ce qu'elle comprend des fragments tels que definis ci-dessus, en parti- 
culier des fragments d' amplification ou des fragments de restriction, clones dans un 
vecteur recombinant, notamment un vecteur d'expression (banque d' expression). 

15 La presente invention a egalement pour objet des cellules, notam- 

ment des cellules procaryotes, modifies par un vecteur recombinant tel que defini ci- 
dessus. 

La presente invention a egalement pour objet une cellule eucaryote 

genetiquement modifiee exprimant une proteine ou un polypeptide tels que definis ci- 
20 apr£s. Bien evidemment, les termes "cellule eucaryote genetiquement modifiee" ne 

designent pas une cellule modifiee par un virus sauvage. 

Selon un mode de realisation avantageux de ladite cellule, elle est 

susceptible d'etre obtenue par transfection par Tun quelconque des vecteurs mention- 

nes aux alineas k) a n) ci-dessus. 
25 Selon une disposition avantageuse de ce mode de realisation, il s'agit 

de la cellule FRhK4-Ssol-30, d6pos£e k la CNCM le 22 novembre 2004, sous le n°I- 

3325. 

Les vecteurs recombinants tels que definis ci-dessus et les cellules 
transform^es par lesdits vecteurs d'expression sont avantageusement utilises pour la 
30 production des proteines et des peptides correspondants. Les banques d'expression 
derivees desdits vecteurs, ainsi que les cellules transformees par lesdites banques 
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d'expression sont avantageusement utilis6es pour identifier les Epitopes immunog^nes 
(Epitopes B et T) des prolines du coronavirus associe au SRAS. 

La prSsente invention a egalement pour objet les prolines et les 
peptides purifies ou isotees, caract^rises en ce qu'ils sont codes par le polynucleotide 
5 ou Tun de ses fragments tels que d&finis ci-dessus. 

Selon un mode de realisation avantageux de l'invention, iadite 
proteine est selectionnee dans le groupe constitue par : 

- la proline S de sequence SEQ ID NO :3 ou son ectodomaine 

- la proteine E de sequence SEQ ID NO :14 
10 - la proline M de sequence SEQ ID NO : 1 7 

- la proline N de sequence SEQ ID NO : 37 

- les proteines codees par les ORFs : ORFla, ORFlb, ORF3, ORF4 
et ORF7 a ORF11, ORF13 et ORF14 de sequence respectivement, SEQ ID NO :74, 
75, 10, 12, 22, 24, 26, 28, 30, 33 et 35. 

15 On utilisera ci-apres indifferemment les termes « ectodomaine de la 

proteine S » et « forme soluble de la proteine S ». 

Selon un mode de realisation avantageux de r invention, ledit poly- 
peptide est constitue des acides amines correspondant aux positions 1 k 1193 de la 
sequence en acides amines de la proteine S 

20 Selon un autre mode de realisation avantageux de l'invention, ledit 

peptide est seiectionne dans le groupe constitue par : 

a) les peptides correspondant aux positions 14 a 1193 et 475 k 1193 
de la sequence en acides amines de la proteine S, 

b) les peptides correspondant aux positions 2 a 14 (SEQ ID NO : 69) 
25 et 100 a 221 de la sequence en acides amines de la proteine M ; ces peptides corres- 
pondent respectivement a l'ectodomaine et k Tendodomaine de la proteine M, et 

c) les peptides correspondant aux positions 1 a 12 (SEQ ID NO : 70) 
et 53 k 76 (SEQ ID NO : 71) de la sequence en acides amines de la proteine E ; ces 
peptides correspondent respectivement k V ectodomaine et k T extremite C-terminale de 

30 la proteine E, et 
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d) les peptides de 5 k 50 acides amines consScutifs, de preference de 
10 a 30 acides amines, inclus ou chevauchant partiellement ou totalement la sequence 
des peptides tels que definis en a), b) ou c). 

La pr^sente invention a egalement pour objet un peptide caracterise 
5 en ce qu'il pr^sente une sequence de 7 k 50 acides amines incluant un residu d'acide 
amine seiectionne dans le groupe constitue par : 

- F alanine situ6e en position 2552 de la sequence en acides amines 
de la proteine codee par PORFla. 

- la serine situ^e en position 577 de la sequence en acides amines de 
1 0 la proline S de la souche de S ARS-CoV telle que definie ci-dessus, 

- la glycine en position 11 de la sequence en acides amines de la 
proteine codee par TORF3 de la souche de SARS-CoV telle que definie ci-dessus, 

- la serine en position 154 de la sequence en acides amines de la 
proteine M de la souche de SARS-CoV telle que definie ci-dessus. 

15 La pr£sente invention a egalement pour objet un anticorps ou un 

fragment d'anticorps polyclonal ou monoclonal, susceptible d'etre obtenu par immu- 
nisation d'un animal avec un vecteur recombinant tel que defini ci-dessus, une banque 
d'ADNc telle que definie ci-dessus ou bien une proteine ou un peptide tels que definis 
ci-dessus, caracterise en ce qu'il se lie avec Tune au moins des proteines codees par le 

20 SARS-CoV telles que definies ci-dessus. 

L'invention englobe les anticorps polyclonaux, les anticorps mono- 
clonaux, les anticorps chimeriques tels que les anticorps humanises, ainsi que leurs 
fragments (Fab, Fv, scFv). 

La pr^sente invention a egalement pour objet un hybridome produi- 

25 sant un anticorps monoclonal contre la proteine N, caracterise en ce qu'il est choisi 
parmi les hybridomes suivants : 

- i'hybridome produisant Tanticorps monoclonal 87, depose k la 
CNCM le l er decembre 2004 sous le numero 1-3328, 

- I'hybridome produisant Tanticorps monoclonal 86, depose a la 
30 CNCM le l er decembre 2004 sous le numero 1-3329, 

- I'hybridome produisant l'anticorps monoclonal 57, depose a la 
CNCM le l er decembre 2004 sous le numero 1-3330, et 
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- l'hybridome produisant l'anticorps monoclonal 156, depose h la 
CNCM Ie l er decembre 2004 sous le numero 1-333 1. 

La presente invention a egalement pour objet un anticorps ou 
fragment d' anticorps polyclonal ou monoclonal dirig6 contre la prot&ne N, caract£ris6 
5 en ce qu'il est produit par un hybridome tel que defini ci-dessus. 

Au sens de la presente invention, on entend par anticorps 
chim&ique, relativement a un anticorps d'une esp£ce animale particuliere ou d'une 
classe particuliere d'anticorps, un anticorps comprenant tout ou partie d'une chaine 
lourde et/ou d'une chaine legere d f un anticorps d'une autre espece animale ou d'une 
10 autre classe d'anticorps. 

Au sens de la presente invention, on entend par anticorps humanise 
une immmunoglobuline humaine dans laquelle les r£sidus des CDRs 
(Complementary-Determining Regions) qui forment le site de liaison a Tantigene sont 
remplaces par ceux d ! un anticorps monoclonal non-humain poss^dant la specificite, 
15 l'affinite ou l'activite recherch6es. Par comparaison avec les anticorps non-humains, 
les anticorps humanisms sont moins immunogenes et possedent une demi-vie prolon- 
gee chez l'Homme car ils ne possedent qu'une faible proportion de sequences non- 
humaines etant donn£ que la quasi-totalite des residus des regions FR (Framework) et 
de la region constante (Fc) de ces anticorps sont ceux d'une sequence consensus 
20 d'immunoglobulines humaines. 

La presente invention a egalement pour objet une puce ou filtre a 
proline, caract£ris6 en ce qu'il comprend une proline, un peptide ou bien un anti- 
corps tels que definis ci-dessus. 

Les puces k proline selon r invention sont preparees par les 
25 methodes classiques, connues en elles-mSmes. Parmi les supports approprtes sur 
lesquels peuvent Stre immobilises des prolines, on peut citer ceux en mattere 
plastique ou en verre, notamment sous la forme de microplaques. 

La presente invention a egalement pour objet des reactifs derives de 
la souche isotee de coronavirus assocte au SRAS, issue du pr61evement repertory sous 
30 le n° 031589, utiles pour P etude et le diagnostic de Pinfection provoquee par un coro- 
navirus assocte au SRAS, lesquels reactifs sont s£lectionnes dans le groupe constitue 
par : 
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(a) une paire d' amorces, une sonde ou une puce k ADN telles que 

definies ci-dessus, 

(b) un vecteur recombinant ou une cellule modiftee tels que definis 

ci-dessus, 

5 (c) une souche isolee de coronavirus ou un polynucleotide tels que 

ddfinis ci-dessus, 

(d) une proline ou un peptide tel que defini ci-dessus, 

(e) un anticorps ou fragment d' anticorps tels que definis ci-dessus, et 

(f) une puce a prot&ne telle que definie ci-dessus. 

10 Ces differents reactifs sont prepares et utilises selon les techniques 

classiques de biologie moteculaire et d'immunologie, en suivant les protocoles 
standards tels que ceux decrits dans Current Protocols in Molecular Biology 
(Frederick M. AUSUBEL, 2000, Wiley and Son Inc., Library of Congress, USA), 
dans Current Protocols in Immunology (John E. Cologan, 2000, Wiley and Son Inc. 

1 5 Library of Congress, USA) et dans Antibodies : A Laboratory Manual (E. Howell and 
D Lane, Cold Spring Harbor Laboratory, 1988) 

Les fragments d'acide nucl&que selon l'invention sont pr<§par6s et 
utilises selon les techniques classiques telles que dSfinies ci-dessus. Les peptides et les 
prolines selon Pinvention sont prepares par les techniques d'ADN recombinant, 

20 connues de THomme du metier, notamment a l'aide des vecteurs recombinants tels 
que definis ci-dessus. Alternativement, les peptides selon Tinvention peuvent etre 
prepares par les techniques classiques de synthese en phase solide ou liquide, connues 
de THomme du metier. 

Les anticorps polyclonaux sont prepares par immunisation d'un 

25 animal approprte avec une proteine ou un peptide tels que definis ci-dessus, <§ventuel- 
lement coupte h la KLH ou k I'albumine et/ou associe a un adjuvant approprie tel que 
l'adjuvant de Freund (complet ou incomplet) ou Thydroxyde d ! alumine ; apres obten- 
tion d'un titre en anticorps satisfaisant, les anticorps sont rScoltes par prStevement du 
serum des animaux immunises et enrichis en IgG par precipitation, selon les 

30 techniques classiques, puis les IgG specifiques des prolines du SARS-CoV sont 
eventuellement purifiees par chromatographie d'affinite sur une colonne appropriee 
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sur laquelle sont fix6s ledit peptide ou ladite prot&ne, tels que definis ci-dessus, de 
fa9on a obtenir une preparation d ! IgG monospecifiques. 

Les anticorps monoclonaux sont produits k partir d'hybridomes 
obtenus par fusion de lymphocytes B d'un animal immunise par une proteine ou un 
peptide tels que definis ci-dessus avec des myelomes, selon la technique de KShler et 
Milstein (Nature, 1975, 256, 495-497) ; les hybridomes sont cultivSs in vitro, notam- 
ment dans des fermenteurs ou produits in vivo, sous forme d'ascite ; alternativement 
lesdits anticorps monoclonaux sont produits par genie g&i&ique comme d6crit dans le 
brevet americain US 4,816,567. 

Les anticorps humanises sont produits par des methodes g£n£rales 
comme celles dScrites dans la Demande Internationale WO 98/45332. 

Les fragments d'anticorps sont produits a partir des regions Vh et 
Vl clon^es, k partir des ARNm d'hybridomes ou de lymphocytes spl&iiques d'une 
souris immunis^e ; par exemple, les fragments Fv, scFv ou Fab sont exprimSs a la 
surface de phages filamenteux selon la technique de Winter et Milstein (Nature, 1991, 
349, 293-299) ; apres plusieurs Stapes de selection, les fragments d'anticorps 
specifiques de l'antig£ne sont isoles et exprim^s dans un systeme d'expression appro- 
pri£, par les techniques classiques de clonage et d'expression d'ADN recombinant. 

Les anticorps ou leur fragments tels que definis ci-dessus, sont 
purifies par les techniques classiques connues de l'Homme du metier, telles que la 
chromatographic d'affinite. 

La prSsente invention a en outre pour objet Putilisation d'un produit 
s£lectionne dans le groupe constitue par : une paire d' amorces, une sonde, une puce k 
ADN, un vecteur recombinant, une cellule modifiee, une souche isolee de coronavirus, 
un polynucleotide, une proline ou un peptide, un anticorps ou un fragment 
d'anticorps et une puce k proline tels que definis ci-dessus, pour la preparation d'un 
r^actif de detection et Sventuellement de g&iotypage/s6rotypage, d'un coronavirus 
associe au SRAS. 

Les proteines et les peptides selon Pinvention, qui sont aptes k etre 
reconnus et/ou k induire la production d'anticorps specifiques du coronavirus associ6 
au SRAS, sont utiles pour le diagnostic de Pinfection par un tel coronavirus ; 
Pinfection est d&ect6e, par une technique appropriee- notamment EIA, ELISA, RIA, 



WO 2005/056781 PCI7FR2004/003105 

23 

immunofluorescence-, k partir d'un Echantillon biologique pr61ev6 chez un individu 
susceptible d'etre infecte. 

Selon une disposition avantageuse de ladite utilisation, lesdites 
prolines sont s£lectionn£es dans le groupe constitue par les proteines S, E, M et/ou N 
5 et les peptides tels que definis ci-dessus. 

Les proteines S, E, M et/ou N et les peptides d£riv£s de ces prolines 
tels que definis ci-dessus, par exemple la proline N, sont utilisees pour le diagnostic 
indirect d'une infection h coronavirus associ£ au SRAS (diagnostic seroiogique ; 
detection d'anticorps specifiques du SARS-CoV), notamment par une methode 
10 immunoenzymatique (ELISA). 

Les anticorps et les fragments d'anticorps selon Pinvention, 
notamment ceux dirig6s contre les proteines S, E, M et/ou N et les peptides derives 
tels que definis ci-dessus, sont utiles pour le diagnostic direct d'une infection k coro- 
navirus assocte au SRAS ; la detection de prot6ine(s) du SARS-CoV est r<§alis<§e par 
15 une technique approprtee, notamment EIA, ELISA, RIA, immunofluorescence a partir 
d'un echantillon biologique preleve chez un individu susceptible d'etre infecte. 

La pr6sente invention a egalement pour objet une m£thode de detec- 
tion d'un coronavirus associe au SRAS, a partir d'un echantillon biologique, laquelle 
methode est caracterisee en ce qu'elle comprend au moins : 
20 (a) la mise en contact dudit echantillon biologique avec au moins un 

anticorps ou un fragment d'anticorps, une proteine, un peptide ou bien une puce ou un 
filtre a proteine ou a peptide tels que definis ci-dessus, et 

(b) la revelation par tout moyen approprie des complexes antigene- 
anticorps formes en (a), par exemple par EIA, ELISA, RIA, ou par immunofluores- 
25 cence. 

Selon un mode de mise en oeuvre avantageux dudit procede l'etape 

(a) comprend : 

(ai) la mise en contact dudit echantillon biologique avec au moins un 
premier anticorps ou un fragment d'anticorps qui est fixe sur un support approprie, 
30 notamment une microplaque, 

(a. 2 ) le lavage de la phase solide, et 
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(a3> P addition d'au moins un second anticorps ou un fragment 
d' anticorps, different du premier, ledit anticorps ou fragment d' anticorps etant 
eventuellement marque de fa9on appropriee. 

Ce precede qui permet de capturer les particules virales pr^sentes 
5 dans Pechantillon biologique est egalement d^nomme procede d'immunocapture. 

Par exemple : 

- Petape (a0 est r^alisee avec au moins un premier anticorps mono- 
clonal ou polyclonal ou un fragment de ceux-ci, dirige contre la proteine S, M, et/ou 
E, et/ou un peptide correspondant k Pectodomaine de Pune de ces prolines (peptides 

10 M2-14ouEM2) 

- Petape (a3) est r^alisee avec au moins un anticorps ou un fragment 
d' anticorps dirige contre un autre epitope de la meme proteine ou de preference contre 
une autre proteine, de maniere preferee contre une proteine interne telle que la nuclSo- 
proteine N ou Pendodomaine de la proteine E ou M, de maniere encore plus preferee 

15 il s'agit d'anticorps ou de fragments d'anticorps dirig6s contre la proteine N qui est 
tres abondante dans la particule virale ; lorsqu'un anticorps ou un fragment 
d'anticorps dirige contre une proteine interne (N) ou contre Pendodomaine des 
proteines E ou M est utilise, le dit anticorps est incube en presence de detergent, 
comme le Tween 20 par exemple, k des concentrations de Pordre de 0,1 %. 

20 - Petape (b) de revelation des complexes antigene-anticorps formes 

est realisee, soit directement a Paide d'un second anticorps marque par exemple avec 
de la biotine ou une enzyme appropriee telle que la peroxydase ou la phosphatase 
alcaline, soit indirectement a Paide d'un serum anti-immunoglobulines marque 
comme ci-dessus. Les complexes ainsi formes sont reveies a Paide d'un substrat 

25 approprie. 

Selon une mise en oeuvre preferee de cet aspect de Tinvention, 
rechantillon biologique est melange k l'anticorps monoclonal de revelation prealable- 
ment a sa mise en contact avec les anticorps monoclonaux de capture. Le cas echeant, 
le melange serum-anticorps de revelation est incube pendant au moins 10 minutes a 
30 temperature ambiante avant d'etre applique sur la plaque. 

La presente invention a egalement pour objet un test d'immuno- 
capture destine k detecter une infection par le coronavirus associe au SRAS par 
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detection de la nucteoproteine native (proteine N), en particulier caract^rise en ce que 
l'anticorps utilise pour la capture de la nucteoproteine virale native est un anticorps 
monoclonal sp<§cifique de la region centrale et/ou d'un Epitope conformational. 

Selon un mode de realisation dudit test, l'anticorps utilise pour la 
5 capture de la proteine N est l'anticorps monoclonal Acm87, produit par l'hybridome 
depose a la CNCM le l er decembre 2004 sous le numero 1-3328. 

Selon un autre mode de realisation dudit test d'immunocapture, 
l'anticorps utilise pour la capture de la proteine N est l'anticorps monoclonal Acm86, 
produit par l'hybridome depose a la CNCM le l er decembre 2004 sous le numero I- 
10 3329. 

Selon un autre mode de realisation dudit test d'immunocapture, les 
anticorps monoclonaux Acm86 et Acm87 sont utilises pour la capture de la proteine 
N. 

Dans les tests d'immunocapture selon l'invention, on peut utiliser 
15 pour la revelation de la proline N, l'anticorps monoclonal Acm57, produit par 
l'hybridome depose a la CNCM le l er decembre 2004 sous le numero 1-3330, ledit 
anticorps etant conjugue k une molecule ou une particule r6velatrice. 

Conformement audit test d'immunocapture, une combinaison des 
anticorps Acm57 et Acm87, conjugues a une molecule ou une particule rev£latrice, est 
20 utilis^e pour la revelation de la proline N. 

Une molecule revelatrice peut Stre un atome radioactif, un colorant, 
une molecule fluorescente, un fluorophore, une enzyme ; une particule revelatrice peut 
etre, par exemple : de l'or colloidal, une particule magnetique ou une bille de latex. 

La presente invention a egalement pur objet un reactif de detection 
25 d'un coronavirus associe au SRAS, caracterise en ce qu'il est seiectionne dans le 
groupe constitue par : 

(a) une paire d'amorces ou une sonde telles que definies ci-dessus, 
(b) un vecteur recombinant tel que defini ci-dessus ou une cellule 
modifiee telle que definie ci-dessus, 
30 ( c ) une souche isoiee de coronavirus telle que definie ci-dessus ou un 

polynucleotide tel que defini ci-dessus, 

(d) un anticorps ou un fragment d'anticorps tel que defini ci-dessus, 
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(e) une combinaison d'anticorps comprenant les anticorps monoclo- 
naux Acm86 et/ou Acm87, et l'anticorps monoclonal Acm57, telle que definie ci- 
dessus, 

(f) une puce ou un filtre tels que dEfinis ci-dessus. 

5 La prEsente invention a Egalement pour objet une methode de detec- 

tion d'une infection par un coronavirus associe au SRAS, k partir d'un echantillon 
biologique, par ELISA IgG indirect utilisant la proline N, laquelle methode est 
caracterisEe en ce que les plaques sont sensibilisees par une solution de proteine N k 
une concentration comprise entre 0,5 et 4|ng/mL, de preference 2ng/mL, dans un 
1 0 tampon PBS 1 OmM pH 7,2, rouge de phenol k 0,25mL /L. 

La presente invention a, en outre, pour objet une methode de detec- 
tion d'une infection par un coronavirus associE au SRAS, k partir d'un Echantillon 
biologique, par ELISA double Epitope, caractErisee en ce que le serum k tester est 
melange k l'antigene de revelation, ledit melange etant ensuite mis au contact de l'anti- 
1 5 gene fixe sur un support solide. 

Selon une variante des tests de detection des coronavirus associS au 
SRAS, ces tests combinent un ELSA utilisant la proline N, et un autre ELSA utilisant 
la proteine S, tel que decrit plus bas. 

La prEsente invention a aussi pour objet un complexe immun forme 
20 d'un anticorps ou d'un fragment d'anticorps polyclonal ou monoclonal tel que defini 
ci-dessus, et d ! une proteine ou d'un peptide du coronavirus associE au SRAS. 

La pr6sente invention a en outre pour objet un kit de detection d'un 
coronavirus associE au SRAS, caractErisE en ce qu'il comprend au moins un rEactif 
sElectionnE dans le groupe constitue par : une paire d'amorces, une sonde, une puce a 
25 ADN ou k ARN, un vecteur recombinant, une cellule modifiee, une souche isolee de 
coronavirus, un polynucleotide, une proteine ou un peptide, un anticorps, et une puce k 
protEine tels que definis ci-dessus. 

La prEsente invention a en outre pour objet, une composition 
immunogene, caracterisEe en ce qu'elle comprend au moins un produit selectionn6 
30 dans le groupe constituE par : 

a) une proteine ou un peptide tels que definis ci-dessus, 
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b) un polynucleotide de type ADN ou ARN ou Tun de ses fragments 
representatifs tels que definis ci-dessus, de sequence choisie parmi : 

(i) la sequence SEQ ID NO : 1 ou son Equivalent ARN 

(ii) la sequence hybridant dans des conditions de forte stringence 
5 avec la sequence SEQ ID NO : 1 , 

(iii) la sequence compiementaire de la sequence SEQ ID NO : 1 ou 
de la sequence hybridant dans des conditions de forte stringence avec la sequence 
SEQ ID NO :1, 

(iv) la sequence nucieotidique d'un fragment representatif du poly- 
10 nucleotide tel que defini en (i), (ii) ou (iii), 

(v) la sequence telle que definie en (i), (ii), (iii) ou (iv), modifiee, et 

c) un vecteur d* expression recombinant comprenant un polynucleo- 
tide tel que defini en b), et 

d) une banque d'ADNc telle que definie ci-dessus, 

15 ladite composition immunogene etant capable d'induire une immunity humorale ou 
cellulaire protectrice specifique du coronavirus associe au SRAS, notamment la 
production d'un anticorps dirige contre un epitope specifique du coronavirus associe 
au SRAS. 

Les proteines et les peptides tels que definis ci-dessus, notamment 
20 les proteines S, M, E et/ou N et les peptides derives, ainsi que les molecules d'acide 
nucieique (ADN ou ARN) codant lesdites proteines ou lesdits peptides, sont de bons 
candidats vaccin et peuvent etre utilisees dans des compositions immunogenes pour la 
production d'un vaccin contre le coronavirus associe au SRAS. 

Selon un mode de realisation avantageux des compositions selon 
25 Pinvention, elles contiennent en outre, au moins un vehicule pharmaceutiquement 
acceptable et eventuellement des substances porteuses et/ou des adjuvants. 

Les vehicules pharmaceutiquement acceptables, les substances 
porteuses et les adjuvants sont ceux classiquement utilises. 

Les adjuvants sont avantageusement choisis dans le groupe constitue 
30 par des emulsions huileuses, de la saponine, des substances minerales, des extraits 
bacteriens, de l'hydroxyde d'alumine et le squatene. 
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Les substances porteuses sont avantageusement seiectionnees dans 
le groupe constitue par des liposomes unilamellaires, des liposomes multilamellaires, 
des micelles de saponine ou des microspheres solides de nature saccharidique ou 
aurifere. 

5 Les compositions selon l'invention, sont administrees par voie 

generale, notamment intramusculaire ou sous-cutan6e ou bien par voie locale notam- 
ment nasale (aerosol). 

La presente invention a egalement pour objet l'utilisation d'une 
proline ou d'un peptide isole ou purifie presentant une sequence selectionnee dans le 
10 groupe constitue par les sequences SEQ ID NO : 3, 10, 12, 14, 17, 22, 24, 26, 28, 30, 
33, 35, 37, 69, 70, 71, 74 et 75 pour former un complexe immun avec un anticorps 
dirige specifiquement contre un Epitope du coronavirus associe au SRAS. 

La presente invention a egalement pour objet un complexe immun 
forme d'une proteine ou d'un peptide isole ou purifie presentant une sequence seiec- 
15 tionnee dans le groupe constitue par les sequences SEQ ID NO : 3, 10, 12, 14, 17, 22, 
24, 26, 28, 30, 33, 35, 37, 69, 70, 71, 74 et 75, et d'un anticorps dirige specifiquement 
contre un epitope du coronavirus associe au SRAS. 

La presente invention a egalement pour objet l'utilisation d'une 
proteine ou d'un peptide isole ou purifie presentant une sequence selectionnee dans le 
20 groupe constitue par les sequences SEQ ID NO : 3, 10, 12, 14, 17, 22, 24, 26, 28, 30, 
33, 35, 37, 69, 70, 71, 74 et 75 pour induire la production d'un anticorps capable de 
reconnaitre specifiquement un epitope du coronavirus associe au SRAS. 

La presente invention a egalement pour objet l'utilisation d'un poly- 
nucleotide isol£ ou purifie presentant une sequence selectionnee dans le groupe 
25 constitue par les sequences SEQ ID NO : 1, 2, 4, 7, 8, 13, 15, 16, 18, 19, 20, 31, 36 et 
38 pour induire la production d'un anticorps dirige contre la proteine codee par ledit 
polynucleotide et capable de reconnaitre specifiquement un epitope du coronavirus 
associe au SRAS 

La presente invention a egalement pour objet des anticorps mono- 
30 clonaux reconnaissant la proteine S native d'un coronavirus associe au SRAS. 

La presente invention a egalement pour objet l'utilisation d'une 
proteine ou d'un polypeptide de la famille de la proteine S, telle que definie ci-dessus, 
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ou d'un anticorps reconnaissant la proteine S native, tel que defini ci-dessus, pour 
d6tecter une infection par un coronavirus associe au SRAS, k partir d'un 6chantillon 
biologique. 

La pr^sente invention a egalement poiir objet une m6thode de d£tec- 
5 tion d'une infection par un coronavirus associe au SRAS, k partir d'un <§chantillon 
biologique, caracteris6e en ce que la detection est effectuee par ELISA utilisant la 
proteine S recombinante, exprimee dans un systeme eucaryote. 

Selon un mode de mise en oeuvre avantageux de ladite m6thode, il 
s'agit d'une m&hode par ELISA double Epitope, et le serum a tester est melange a 
10 l'antigene de relation, ledit melange etant ensuite mis au contact de l'antig&ie fixe 
sur un support solide. 

La pr^sente invention a aussi pour objet un complexe immun forme 
d'un anticorps ou d'un fragment d'anticorps monoclonal reconnaissant la proteine S 
native, et d'une proteine ou d'un peptide du coronavirus associe au SRAS, 
15 La pr^sente invention a egalement pour objet un complexe immun - 

form6 d'une proline ou d'un polypeptide de la famille de la prot6ine S, telle que 
definie ci-dessus, et d'un anticorps dirige sp^cifiquement contre un epitope du coro- 
navirus associe au SRAS. 

La presente invention a en outre pour objet un kit ou coffret de 
20 detection d'un coronavirus associe au SRAS, caract6ris6 en ce qu'il comprend au 
moins un reactif selectionne dans le groupe constitue par : une proteine ou polypeptide 
de la famille de la prot6ine S, telle que definie ci-dessus, un acide nucl&que codant 
pour une proteine ou polypeptide de la famille de la proline S, telle que definie ci- 
dessus, une cellule exprimant une proline ou polypeptide de la famille de la proline 
25 S, telle que definie ci-dessus, ou un anticorps reconnaissant la proteine S native d'un 
coronavirus associe au SRAS. 

La presente invention a pour objet une composition immunogdne 
et/ou vaccinale, caract&isee en ce qu'elle comprend un polypeptide ou une proteine 
recombinante de la famille de la protSine S, telle que definie ci-dessus, obtenu dans un 
30 systeme d'expression eucaryote. 

La presente invention a Egalement pour objet une composition 
immunogene et/ou vaccinale, caract6ris6e en ce qu f elle comprend un vecteur ou virus 
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recombinant, exprimant une proteine ou un polypeptide de la famille de la proteine S, 
telle que definie ci-dessus. 

Outre les dispositions qui precedent, l'invention comprend encore 
d'autres dispositions, qui ressortiront de la description qui va suivre, qui se refere a 
5 des exemples de mise en ceuvre du polynucleotide repr6sentant le gdnome de la 
souche de SARS-CoV issue du prelevement repertorie sous le numero 031589, et des 
fragments d'ADNc derives objets de la presente invention, ainsi qu'au Tableau I 
presentant la liste des sequences : 



Tableau I : Liste des sequences 



numero 
^identification 


Sequence 


Position de 
I'ADNc en 

reference a 
Genbank 

AY274119.3 


Numero de 
depot a la CNCM 

du plasmide 
correspondant 


SEQ ID NO : 1 


genome de la 
souche issue du 
prelevement 
031589 


- 


- 


SEQ ID NO : 2 


ORF-S* 


21406-25348 


— 


SEQ ID NO : 3 


Proteine S 


- 


— 


SEQ ID NO : 4 


ORF-S** 


21406-25348 


I-3059 


SEQ ID NO : 5 


fragment Sa 


21406-23454 


1-3020 


SEQ ID NO : 6 


fragment Sb 




I wU I C 


SEQ ID NO : 7 


ORF-3+ORF-4* 


25110-26244 




SEQ ID NO : 8 


ORF-3+ORF-4** 


25110-26244 


1-3126 


SEQ ID NO : 9 


ORF3 






SEQ ID NO : 10 


Proteine ORF-3 






SEQ ID NO : 11 


ORF4 






SEQ ID NO : 12 


Proteine ORF-4 






SEQ ID NO : 13 


ORF-E* 


26082-26413 




SEQ ID NO : 14 


Proteine E 






SEQ ID NO : 15 


ORF-E** 


26082-26413 


I-3046 


SEQ ID NO : 16 


ORF-M* 


26330-27098 




SEQ ID NO : 17 


Proteine M 






SEQ ID NO : 18 


ORF-M** 


26330-27098 


J-3047 


SEQ ID NO : 19 


ORF7a 11* 


26977-28218 




SEQ ID NO : 20 


ORF7 a 11** 


26977-28218 


1-3125 


SEQ ID NO : 21 


ORF7 






SEQ ID NO : 22 


Proteine ORF7 






SEQ ID NO : 23 


ORF8 






SEQ ID NO : 24 


Proteine ORF8 






SEQ ID NO : 25 


ORF9 
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SEQ ID NO : 26 


Proline ORF9 






SEQ ID NO : 27 


ORF10 


- 


- 


SEQ ID NO : 28 


Proline ORF10 


_ 


_ 


SEQ ID NO : 29 


ORF11 


_ 


_ 


SEQ ID NO : 30 


Proteine ORF1 1 


- 


- 


SEQ ID NO: 31 


OrFlab 


265-21485 


- 


SEQ ID NO : 32 


ORF13 


28130-28426 


- 


I SEQ ID NO : 33 


Proteine ORF13 


- 


- 


SEQ ID NO : 34 


ORF14 




- 


SEQ ID NO : 35 


Proteine ORF14 


28583-28795 




SEQ ID NO : 36 


ORF-N* 


28054-29430 




SEQ ID NO : 37 


Proteine N 


- 




SEQ ID NO : 38 


ORF-N** 


28054-29430 


I-3048 


SEQ ID NO : 39 


5'non-codante** 


1-204 


1-3124 


SEQ ID NO : 40 


3'non-codante** 


28933-29727 


1-3123 


SEQ ID NO : 41 


ORFlab 

Fragment L0 


30-500 




SEQ ID NO : 42 


Fragment L1 


211-2260 


- 


SEQ ID NO : 43 


Fragment L2 


2136-4187 




SEQ ID NO : 44 


Fragment L3 


3892-5344 




SEQ ID NO : 45 


Fragment L4b 


4932-6043 




SEQ ID NO : 46 


Fragment L4 


5305-7318 


_ 


SEQ ID NO : 47 


Fragment L5 


7275-9176 


- 


SEQ ID NO : 48 


Fragment L6 


9032-11086 




SEQ ID NO : 49 


Fragment L7 


10298-12982 


- 


SEQ ID NO : 50 


Fragment L8 


12815-14854 




SEQ ID NO : 51 


Fragment L9 


14745-16646 


_ 


SEQ ID NO : 52 


Fragment L10 


16514-18590 


_ 


SEQ ID NO : 53 


Fragment L1 1 


18500-20602 


- 


SEQ ID NO : 54 


Fragment L12 


20319-22224 




SEQ ID NO : 55 


Amorce N sens 


- 


- 


SEQ ID NO : 56 


Amorce N 
antisens 






SEQ ID NO : 57 


Amorce Sc sens 






SEQ ID NO : 58 


Amorce Sl sens 


- 


- 


SEQ ID NO : 59 


Amorce S c e t S L 
antisens 






SEQ ID NO : 60 


Amorce sens 
serie 1 


28507-28522 




SEQ ID NO : 61 


Amorce antisens 
serie 1 


28774-28759 




SEQ ID NO : 62 i 


Amorce sens 
serie 2 


28375-28390 




SEQ ID NO : 63 


Amorce antisens 
serie 2 


28702-28687 




SEQ ID NO : 64 


Sonde 1/serie 1 


28561-28586 
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SEQ ID NO : 65 


Sonde 2/serie 1 


28588-28608 




SEQ ID NO : 66 


Sonde 1/serie 2 


28541-28563 




SEQ ID NO : 67 


Sonde 2/serie 2 


28565-28589 




SEQ ID NO : 68 


Amorce ancre 
14T 






SEQ ID NO : 69 


Peptide M2-14 


- 


- 


SEQ ID NO : 70 


Peptide E1-12 


- 


- 


SEQ ID NO: 71 


Peptide E53-76 


- 


- 


SEQ ID NO : 72 


5'non-codante* 


1-204 


- 


SEQ ID NO : 73 


3'non-codante* 


28933-29727 


- 


SEQ ID NO : 74 


Proteine ORF1a 


- 


- 


SEQ ID NO : 75 


Proteine ORF1b 


- 


- 


SEQ ID NO:76-139 


Amorces 






SEQ ID NO:140 


Pseudogene de S 






SEQ ID NO:141-148 


amorces 






SEQ ID NO:149 


Aa1-13deS 






SEQIDNO:150 


polypeptide 






SEQ ID NO:151-158 


amorces 







































* produit d'amplification PCR (amplicon) 



** insert clone dans le plasmide depose k la CNCM 
ainsi qu'aux dessins annexes dans lesquels : 

- la figure 1 illustre Panalyse par Western-blot de Pexpression in 
5 vitro des proteines recombinantes N, Sc et Sl a partir des vecteurs d'expression 

pIVEX. Piste 1 : pIV2.3N. Piste 2 : pIV2.3S c . Piste 3 : pIV2.3S L . Piste 4 : pIV2.4N. 
Piste 5 : pIV2.4Si ou pIV2.4S c . Piste 6 : pIV2.4S L . L'expression de la proteine GFP 
exprimee k partir du meme vecteur est utilis6e comme contrSle. 

- la figure 2 illustre Panalyse par Slectrophorese en gel de 
10 polyacrylamide en conditions denaturantes (SDS-PAGE) et coloration au bleu de 

Coomassie, de Pexpression in vivo de la proline N k partir des vecteurs d'expression 
pIVEX. La souche d'Ecoli BL21(DE3)pDIA17 transform^ par les vecteurs pi VEX 
recombinants est cultiv6e a 30°C dans du milieu LB, en presence ou en Pabsence 
d'inducteur (IPTG ImM). Piste 1 : pIV2.3N Piste 2 : pIV2.4N. 
15 - la figure 3 illustre Panalyse par 61ectrophor6se en gel de 

polyacrylamide en conditions denaturantes (SDS-PAGE) et coloration au bleu de 
Coomassie, de Pexpression in vivo des polypeptides Sl et Sc a partir des vecteurs 
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d'expression pF/EX. La souche (TEcoli BL21(DE3)pDIA17 transformee .par les 
vecteurs pIVEX recombinants est cultiv^e k 30°C dans du milieu LB, en presence ou 
en l'absence d'inducteur (IPTG ImM). Piste 1 : pIV2.3S c Piste 2 : pIV2.3S L . Piste 3 : 
pIV2.4Si Piste 4 : pIV2.4S L . 

5 - la figure 4 illustre l'activite antigenique des prolines N, S L et S c 

recombinantes produites dans la souche E. coli BL21(DE3)pDIA17 transformee par 
les vecteurs pIVEX recombinants. A : electrophorese (SDS-PAGE) des lysats bacte- 
riens. B et C : Western-blot avec les serums, provenant d'un meme patient infect^ par 
le SARS-CoV, preleves respectivement 8 jours (B : s6rum M12) et 29 jours-(C : 

10 serum M13) aprds le debut des symptomes du SRAS. Piste 1 : pIV2.3N. Piste 2 : 
pIV2.4N, Piste 3 : pF/2.3S c . Piste 4 : pIV2.4 S x . Piste 5 : pIV2.3S L . Piste 6 : pIV2.4S L 

- la figure 5 illustre la purification sur colonne Ni-NTA agarose de la 
proteine N recombinante produite dans la souche E. coli BL21(DE3)pDIA17 k partir 
du vecteur pIV2.3N. Piste 1 : Extrait bact6rien total. Piste 2 : Extrait soluble. Piste 3 : 

15 Extrait insoluble. Piste 4 : Extrait d6pos6 sur la colonne Ni-NTA. Piste 5 : prolines 
non-retenues. Piste 6 : Fractions du pic 1. Piste 7 : Fractions du pic 2. 

- la figure 6 illustre la purification de la proteine Sc recombinante k 
partir des corps d'inclusions produits dans la souche E. coli BL21(DE3)pDIA17 trans- 
formee par le pIV2.4Si.A. Traitement au Triton X-100 (2%) : Piste 1 : Extrait bacte- 

20 rien total. Piste 2 : Extrait soluble. Piste 3 : Extrait insoluble. Piste 4 : Surnageant 
apres traitement au Triton X-100 (2 %). Pistes 5 et 6 : Culot apres traitement au Triton 
X-100 (2 %).B : Traitement k l'ur^e 4M, 5M, 6M et 7M des extraits solubles et inso- 
lubles. 

- la figure 7 repr6sente Timmunoempreinte realisee a l'aide d'un 
25 lysat de cellules infectives par le SARS-CoV et d'un serum de patient atteint de 

pneumopathie atypique. 

- la figure 8 repr6sente des immunoempreintes r6alis6es k Paide 
d'un lysat de cellules infectees par le SARS : CoV et d'immunserums de lapins speci- 
fiques de la nucleoprot6ine N (A) et de la proline de spicule S (B). I.S. : s6rum 
30 immun. p.i. : serum pre-immun. L'immuns6rum anti-N a ete utilise au 1/50000 et 
l'immuns^rum anti-S au 1/10000. 
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- la figure 9 illustre la r6activit6 en ELISA des serums polyclonaux 
monospecifiques de lapin dirig6s contre la proline N ou le fragment court de la 
proline S (Sc), vis-a-vis des proteines recombinantes correspondantes utilises pour 
Fimmunisation. A : lapins P13097, P13081, et P13031 immunises avec la proteine N 

5 recombinante purifie. B: lapins PI 1135, PI 3042, et PI 4001 immunises avec une 
preparation de corps d'inclusions correspondants au fragment court de la proline S 
(Sc). I.S. : serum immun. p.i. : s6rum pre-immun. 

- la figure 10 illustre la reactivity en ELISA de la proteine N 
recombinante purifiee, vis-a-vis de s6rum de patients atteints de pneumonie atypique 

10 causee par le SARS-CoV. Figure 10a : plaques ELISA prepares avec la proteine N a la 
concentration de 4 jag/ml et 2 jag/ml. Figure 10b : plaque ELISA preparee avec la 
prot&ne N a la concentration de 1 |ng/mh Les scrums d6sign6s A, B 3 D, E, F, G, H 
correspondent a ceux du Tableau IV. 

- la figure 11 illustre T amplification par RT-PCR de quantity 
15 d^croissantes d ! ARN synth&ique du gSne N du SARS-CoV (10 7 k 1 copie), k l'aide 

des couples d'amorces n° 1 (N/+/28507,N/-/28774) (A) et n° 2 (N/+/28375,N/-/28702) 
(B). T : amplification rgalisee en l'absence d'ARN. MW : marqueur d ! ADN. 

- la figure 12 illustre 1' amplification par RT-PCR en temps reel 
d'ARN synthetique du g£ne N du SARS-CoV : des quantites decroissantes d f ARN 

20 synthetique en rSpliquat (repli. ; pistes 16 k 29) ainsi que de TARN viral dilue au 
1/20X10" 4 (piste 32) ont <§te amplifies par RT-PCR en temps r<§el a l'aide du kit "Light 
Cycler RNA Amplification Kit Hybridization Probes" et des couples d'amorces et de 
sondes de la serie n° 2, dans les conditions dScrites k l'exemple 8. 

- la figure 13 (figure 13.1 a 13.70) repr^sente la carte de restriction 
25 de la sequence SEQ ID NO : 1 correspondant k Equivalent ADN du genome de la 

souche de SARS-CoV issue du prelevement rSpertorie sous le num6ro 03 1589. 

- la figure 14 montre le r&ultat du test de serologie SRAS par 
ELISA N indirect (lere s&ie de serums testes) 

- la figure 15 montre le r^sultat du test de serologie SRAS par 
30 ELISA N indirect (2eme serie de serums testes) 
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- la figure 16 pr&ente le r6sultat du test de sSrologie SRAS par 
ELISA N double Epitope (lere serie de serums testes) 

- la figure 17 montre le resultat du test de serologic SRAS par 
ELISA N double epitope (2eme serie de serums testes) 

5 - la figure 18 illustre le test de r^activite des anticorps monoclonaux 

anti-N par ELISA sur la nucieoproteine N native du SRAS-CoV. Les anticoips ont et6 
testes sous la forme de surnageants de culture d'hybridomes par un ELISA indirect 
utilisant un lysat irradie de cellules VeroE6 infectees par le SRAS-CoV comme 
antigdne (courbes lysat SRAS). Un controle n^gatif de r^activite est realise pour 
10 chaque anticorps sur un lysat de cellules VeroE6 non infectees (courbes lysat negatif). 
Plusieurs anticorps monoclonaux de sp^cificite connue ont ete utilises comme 
anticorps t&noins n^gatifs : paral-3 dirige contre les antigenes des virus parainfluenza 
de type 1-3 (Bio-Rad) et grippe B dirige contre les antigenes du virus de la grippe de 
type B (Bio-Rad). 

15 - la figure 19 illustre le test de reactivite des anticorps monoclonaux 

anti-N du SRAS-CoV par ELISA sur les antigenes natifs du coronavirus humain 229E 
(HCoV-229E). Les anticorps ont 6te testes sous la forme de surnageants de culture 
d'hybridomes par un test ELISA indirect utilisant un lysat de cellules MRC-5 
infectees par le coronavirus humain 229E comme antigene (courbes lysat 229E). Un 
20 controle negatif d'immunoreactivitg est realise pour chaque anticorps sur un lysat de 
cellules MRC-5 non infectees (courbes lysat negatif). L'anticorps monoclonal 5-1 1H.6 
dirige contre la proteine S du coronavirus humain 229E (Sizun et al. 1998, J. Virol. 
Met. 72 : 145-152) est utilise comme anticorps temoin positif. Les anticorps paral-3 
dirige contre les antigenes des virus parainfluenza de type 1-3 (Bio-Rad) et grippe B 
25 dirige contre les antigenes du virus de la grippe de type B (Bio-Rad) ont 6te ajout6s au 
panel des anticorps monoclonaux testes. 

- la figure 20 montre un test de reactivite des anticorps monoclonaux 
anti-N du SRAS-CoV par western blot sur la nucleoprot&ne N native du SRAS-CoV 
d&iatun§e. Un lysat de cellules VeroE6 infectees par le SRAS-CoV a && prepare dans 
30 le tampon de depdt selon Laemmli et mis a migrer dans un gel SDS a 12% de 
polyacrylamide puis les prolines ont <§te transferees sur membrane de PVDF. Les 
anticorps monoclonaux anti-N testes ont ete utilises pour l'immunoessai k la concen- 
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tration de 0.05 ug/ml. La revelation est faite avec des anticorps anti-IgG(H+L) de 
souris couples a la peroxydase (NA93IV, Amersham) et le systeme ECL+. Deux anti- 
corps monoclonaux ont ete utilises comme temoins negatifs de reactivite : grippe B 
dirige contre les antigenes du virus de la grippe de type B (Bio-Rad) et paral-3 dirige 
5 contre les antigenes des virus parainfluenza de type 1-3 (Bio-Rad). 

- la figure 21 presente les plasmides d'expression en cellules de 
mammiferes de la proteine S du SRAS-CoV. Le cDNA de la S du SRAS-CoV a ete 
insere entre les sites BamHl et Xhol du plasmide d'expression pcDNA3.1(+) 
(Clontech) pour obtenir le plasmide pcDNA-S et entre les sites Nhel et Xhol du 
10 plasmide d'expression pCI (Promega) pour obtenir le plasmide pCI-S. Les sequences 
WPRE et CTE ont ete inser6es dans chacun des deux plasmides pcDNA-S et pCI-S 
entre les sites Xhol et Xbal pour obtenir respectivement les plasmides pcDNA-S- 
CTE, pcDNA-S-WPRE, pCI-S-CTE et pCI-S-WPRE. 

SP : peptide signal predit (aa 1-13) avec le logiciel signalP v2.0 
15 (Nielsen et al., 1997, Protein Engineering, 10 : 1-6) 

TM : region transmembranaire predite (aa 1196-1218) avec le 
logiciel TMHMM v2.0 (Sonnhammer et al., 1998, Proc. of Sixth Int. Conf. on 
Intelligent Systems for Molecular Biology, p 175-182, AAAI Press). II faut noter que 
les acides amines W1194 et PI 195 font possiblement partie de la region trans- 
20 membranaire avec des probabilites respectives de 0,13 et 0,42 

P-CMV : promdteur imm^diat/precoce du cytomegalovirus. BGH 
pA : signal de polyadenylation du gene de 1 'hormone de croissance bovine 

SV40 late pA : signal de polyadenylation tardif du virus SV40 

SD/SA : sites donneur et accepteur d'epissage 
25 WPRE : sequences du "Woodchuck Hepatitis Virus posttranscriptio- 

nal regulatory element" du virus de l'hepatite de la marmotte 

CTE : sequences du "constitutive transport element" du retrovirus 
simien de Mason-Pfizer 

- la figure 22 illustre l'expression de la proteine S apres transfection 
30 de cellules VeroE6. Des extraits cellulaires ont ete prepares 48 heures aprds transfec- 
tion de cellulesVeroE6 par les plasmides pcDNA, pcDNA-S, pCI et pCI-S. Des 
extraits cellulaires ont egalement ete prepares 18 heures aprds infection par le virus 
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recombinant de la vaccine W-TF7.3 et transfection par les plasmides pcDNA ou 
pcDNA-S. A titre de controle, des extraits de cellules VeroE6 ont 6t6 prepares 8 
heures apres infection par le SRAS-CoV a une multiplicity d' infection de 3. lis ont 6t6 
separes sur un gel SDS a 8% d'acrylamide et analyses par western blot a Paide d'un 
5 anticorps polyclonal de lapin anti-S et d'un anticorps polyclonal anti-IgG(H+L) de 
lapin couple a la peroxidase (NA934V, Amersham). Une Schelle de masse moteculaire 
(lcDa) est portee sur la figure. 

SRAS-CoV : extrait de cellules VeroE6 infectees par le SRAS-CoV 
Mock : extrait controle de cellules non infectees 

10 - la figure 23 illustre l'effet des sequences CTE et WPRE sur 

P expression de la proteine S apres transfection de cellules VeroE6 et 293T. Des 
extraits cellulaires ont ete prepares 48 heures aprSs transfection de celluiesVeroE6 (A) 
ou 293T (B) par les plasmides pcDNA, pcDNA-S, pcDNA-S-CTE, pcDNA-S-WPRE, 
pCI-S, pCI-S-CTE et pCI-S-WPRE, separes sur un gel SDS a 8% d'acrylamide et 

15 analyses par western blot a Paide d'un anticorps polyclonal de lapin anti-S et d'un 
anticorps polyclonal anti-IgG(H+L) de lapin couple a la peroxidase (NA934V, 
Amersham). Une echelle de masse moleculaire (kDa) est portee sur la figure. 

SRAS-CoV : extrait de cellules VeroE6 prepares 8 heures apres 
infection par le SRAS-CoV a une multiplicity d' infection de 3. 

20 Mock : extrait controle de cellules VeroE6 non infectees 

- la figure 24 prSsente des vecteurs lentiviraux d6fectifs a DNA flap 
central pour Pexpression de la S du SRAS-CoV, Le cADN de la proteine S du SRAS- 
CoV a 6t6 clone sous la forme d'un fragment BamHl-Xhol dans le plasmide 
pTRIPAU3-CMV contenant un vecteur lentiviral defectif TRIP a DNA flap central 

25 (Sirven et al, 2001, Mol. Ther., 3 :438-448) pour obtenir le plasmide pTRIP-S. Les 
cassettes ^expression optimales constitutes du promoteur immddiat/precoce du virus 
CMV, d'un signal d'epissage, du cDNA de la S et de Tun ou Tautre des signaux post- 
transcriptionnels CTE ou WPRE ont ete substitutes & la cassette EFloc-EGFP du 
vecteur d'expression lentiviral defectif a DNA FLAP central TRIPAU3-EF1 a (Sirven 

30 et al, 2001, Mol. Ther., 3 :438-448) pour obtenir les plasmides pTRIP-SD/SA-S-CTE 
et pTRIP-SD/SA-S-WPRE. 

SP : peptide signal 
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TM : region transmembranaire 

P-CMV : promoteur immediat/pr^coce du cytomegalovirus 

P-EFla : promoteur du gene EFla 

SD/SA : sites donneur et accepteur d'6pissage 
5 WPRE : sequences du "Woodchuck Hepatitis Virus posttranscrip- 

tional regulatory element" du virus de Th6patite de la marmotte 

CTE : sequences du "constitutive transport element" du retrovirus 
simien de Mason-Pfizer 

LTR : « Long terminal repeat » 
10 AU3 : LTR d616te des sequences « promoter/enhancer » 

cPPT : « polypurine tract cis-active sequence » 

CTS : « central termination sequence » 

-la figure 25 montre Tanalyse par western blot de ^expression de la 
S du SRAS-CoV par des lign^es cellulaires transduites par les vecteurs lentiviraux 

15 TRIP-SD/SA-S-WPRE et TRIP-SD/SA-S-CTE. Des extraits cellulaires ont 6t6 
prepares & partir de lign<§es FrhK4-S-CTE et FrhK4-S-WPRE &ablies apres transduc- 
tion par les vecteurs lentiviraux TRIP-SD/SA-S-CTE et TRIP-SD /SA-S-WPRE 
respectivement. lis ont 6te separes sur un gel SDS a 8% d'acrylamide et analyses par 
western blot a Paide d'un anticorps polyclonal de lapin anti-S et d'un conjugue anti- 

20 IgG(H+L) de lapin coupte a la peroxidase. Une echelle de masse moleculaire (kDa) 
est portee sur la figure. 

T- : extrait controle de cellules FrhK-4 

T+ : extrait de cellules FrhK-4 preparees 24h apres infection par le 
SRAS-CoV a une multiplicity d'infection de 3. 

25 - la figure 26 concerne Panalyse de Pexpression de polypeptide Ssol 

par des lignees cellulaires transduites par les vecteurs lentiviraux TRIP-SD/SA-Ssol- 
WPRE et TRIP-SD/SA-Ssol-CTE. La secretion du polypeptide Ssol a ete recherctee 
dans le surnageant d'une serie de clones cellulaires isotes apres transduction de 
cellules FRhK-4 par les vecteurs lentiviraux TRIP-SD/SA-Ssol-WPRE et TRIP- 

30 SD/SA-Ssol-CTE. 5 |il de surnageant dilues au 1/2 dans du tampon de d6pot selon 
Laemmli ont 6t6 analyses par western blot t6v616 par un anticorps monoclonal anti- 
FLAG (M2, Sigma) et uh conjugue anti-IgG(H+L) de souris coupte h la peroxidase. 
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T- : surnageant de la lign<Se FRhK-4 parentale. T+ : surnageant de cellules BHK 
infect6es par un virus recombinant de la vaccine exprimant le polypeptide Ssol. La 
fteche pleine indique le polypeptide Ssol, tandis que la fleche creuse indique une 
reaction crois6e avec une prot6ine d'origine cellulaire. 
5 - la figure 27 montre les r6sultats relatifs a l'analyse du polypeptide 

Ssol purifte 

A. 8, 2, 0.5 et 0.125 \xg de polypeptide recombinant Ssol purifie par 
chromatographie d'affinite anti-FLAG et gel filtration (G75) ont ete s^pares sur gel 
SDS a 8% de polyacrylamide. Le polypeptide Ssol ainsi que des quantity variables de 

10 marqueurs de masse moleculaire (MM) ont 6t€ revetes par coloration au nitrate 
d'argent (Gelcode SilverSNAP stain kit II, Pierce). 

B. Marqueurs etalons pour l'analyse par spectrom&rie de masse 

SELDI-TOF 

IgG : IgG bovine de MM 147300 
1 5 ConA : conalbumine de MM 77490 

HRP : peroxidase de raifort analysee a titre de controle et de MM 

43240 

C. Analyse par spectrom&rie de masse (SELDI-TOF) du poly- 
peptide recombinant Ssol. 

20 Les pics A et B correspondent au polypeptide Ssol simplement et 

doublement charge. 

D. Sequen9age de Fextremite N-terminale du polypeptide 
recombinant Ssol. 5 cycles de degradation d'Edman en phase liquide ont 6t6 realises 
sur un s6quenceur ABI494 (Applied Biosystems). 

25 - la figure 28 illustre Tinfluence d'un signal d'6pissage et des 

sequences CTE et WPRE sur I'efficacit^ de Timmunisation genique k Taide d'ADN 
plasmidique codant la S du SRAS-CoV 

A.Des groupes de 7 souris BALB/c ont 6t6 immunises d deux 
reprises a 4 semaines d'intervalle a Taide de 50 fxg d'ADN plasmidique de pCI, 

30 pcDNA-S, pCI-S, pcDNA-N et pCI-HA. 
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B. Des groupes de 6 souris BALB/c ont ete immunises a deux 
reprises a 4 semaines d'intervalle a l'aide de 2 ug, ^\ig ou 50 ug d'ADN plasmidique 
de pCI, pCI-S, pCI-S-CTE et pCI-S-WPRE. 

Les serums immuns preleves 3 semaines apres la deuxieme immuni- 

5 sation ont et6 analyses par ELISA indirect en utilisant un lysat de cellules VeroE6 
infectees par le SRAS-CoV comme antigene. Les titres en anticorps anti-SRAS-CoV 
sont calcutes comme l'inverse de la dilution produisant une DO specifique de 0,5 
apres revelation par un anticorps polyclonal anti-IgG de souris couple a la peroxidase 
(NA931 V, Amersham) et du TMB (KPL). 

10 - la figure 29 montre la seroneutralisation de l'infectivite du SRAS- 

CoV par les anticorps induits chez la souris apres immunisation genique a l'aide 
d'ADN plasmidique codant la S du SRAS-CoV. Des pools de serums immuns 
preleves 3 semaines apres la deuxieme immunisation ont ete realises pour chacun des 
groupes des experiences decrites dans la figure 28 et evalues pour leur capacite a 

15 seroneutraliser l'infectivite de 100 TCID50 du SRAS-CoV sur cellules FRhK-4. 4 
points sont realises pour chacune des dilutions de raison 2 testees a partir du 1/20. Le 
titre seroneutralisant est calcule selon la methode de Reed et Munsch comme 1' inverse 
de la dilution neutralisant l'infectivite de 2 cupules sur 4. 

A. Groupes de souris BALB/c immunises a deux reprises a 4 
20 semaines d'intervalle a l'aide de 50 ug d'ADN plasmidique de pCI, pcDNA-S, pCI-S, 

pcDNA-N et pCI-HA. □ : serum pr6immun. m : serum immun. 

B. Groupes de souris BALB/c immunises a deux reprises a 4 
semaines d'intervalle a l'aide de 2 ug, lOug ou 50 ug d'ADN plasmidique de pCI, 
pCI-S, pCI-S-CTE et pCI-S-WPRE. 

25 - la figure 30 illustre l'immunoreactivite du polypeptide recombinant 

Ssol vis a vis de serums de patients atteints de SRAS. La reactivite de serums de 
patients a ete analysee par test ELISA indirect contre des phases solides preparees a 
l'aide du polypeptide recombinant Ssol purifie. Les anticorps de patients reagissant 
avec la phase solide a une dilution de 1/400 sont reveles par un anticorps polyclonal 

30 anti-IgG(H+L) humain couple a la peroxidase (Amersham NA933V) et du TMB plus 
H202 (KPL). Les serums de cas probables de SRAS sont identifies par un numero 
d'ordre du Centre National de Reference des Virus Influenzae ainsi que par les 
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initiates du patient et le nombre de jours Scoutes depuis le debut des symptdmes, le 
cas 6cheant. Les scrums TV sont des scrums t&noins de sujets qui ont <§te pr&eves en 
France avant T6pidemie de SRAS survenue en 2003. 

- La figure 31 montre Tinduction d'anticorps diriges contre le SRAS- 
5 CoV apr&s immvinisation avec le polypeptide recombinant Ssol. Deux groupe de 6 

souris ont ete immunises a 3 semaines d'intervalle avec 10 |ag de polypeptide recom- 
binant Ssol (groupe Ssol) adjuve avec de l'hydroxyde d'aluminium ou, k titre de 
contrdle, de l'adjuvant seul (groupe mock).Trois immunisations successives ont ete 
realisees et les serums immuns ont ete pr61ev£s 3 semaines aprds chacune des trois 

10 immunisations (IS1, IS2, IS3). Les serums immuns ont 6X6 analyses par pool pour 
chacun des 2 groupes par ELISA indirect en utilisant un lysat de cellules VeroE6 
infectees par le SRAS-CoV comme antig&ie. Les titres en anticorps anti-SRAS-CoV 
sont calcules comme 1' inverse de la dilution produisant une DO specifique de 0,5 
apres revelation par un anticorps polyclonal anti-IgG de souris couple a la peroxidase 

1 5 (Amersham) et du TMB (KPL). 

- La figure 32 presente l'alignement nucteotidique des sequences du 
gdne synthetique 040530 avec la sequence du gene sauvage de Pisolat 031589 du 
SRAS-CoV. 1-3059 correspond aux nucleotides 21406-25348 de Pisolat 031589 du 
SRAS-CoV depose a la C.N.C.M. sous le numero 1-3059 (SEQ ID NO : 4, plasmide 

20 pSRAS-S). S-040530 est la sequence du gdne synthetique 040530. 

- la figure 33 illustre l'utilisation d'un gene synthetique pour 
i'expression de la S du SRAS-CoV. Des extraits cellulaires prepares 48 heures aprds 
transfection de cellulesVeroE6 (A) ou 293T (B) par les plasmides pCI, pCI-S, pCI-S- 
CTE, pCI-S-WPRE et pCI-Ssynth ont et<§ separes sur un gel SDS a 8% d'acrylamide 

25 et analyses par western blot a l'aide d'un anticorps polyclonal de lapin anti-S et d'un 
anticorps polyclonal anti-IgG(H+L) de lapin couple & la peroxidase (NA934V, 
Amersham). Le western blot est revile par luminescence (ECL+, Amersham) et 
acquisition sur un dispositif d'imagerie num&ique (FluorS, BioRad). Les niveaux 
d' expression de la proline S ont ete mesur£s en quantifiant les 2 bandes majoritaires 

30 rep&rees surl'image. 

- la figure 34 presente un schema de la construction des virus 
vaccine recombinants VV-TG-S, VV-TG-Ssol, VV-TN-S et VV-TN-Ssol 
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A. Les cDNA de la prot&ne S et du polypeptide Ssol du SRAS-CoV 
ont 6t& insert entre les sites BamHl et Smal du plasmide de transfert pTG186 pour 
obtenir les plasmides pTG-S et pTG-Ssol. 

B. Les sequences du promoteur synthetique 480 ont ensuite <§te 
5 substitutes & celles du promoteur 7.5 par ^change du fragment Ndel-Pstl des 

plasmides pTG186poly, pTG-S et pTG-Ssol pour obtenir les plasmides de transfert 
pTN480, pTN-S et pTN -Ssol. 

C. Sequence du promoteur synthetique 480 tel que contenu entre les 
sites Ndel et Pstl des plasmides de transfert de la s6rie pTN. Un site Ascl a et6 insert 

10 pour faciliter les manipulations ult&ieures. Les sites de restriction ainsi que la 
sequence du promoteur sont soulignts 

D. Les virus recombinants de la vaccine sont obtenus par double 
recombinaison homologue in vivo entre la cassette TK des plasmides de transfert des 
series pTG et pTN et le gdne TK de la souche Copenhague du virus de la vaccine. 

15 SP : peptide signal predit (aa 1-13) avec le logiciel signalP v2.0 

(Nielsen et al., 1997, Protein Engineering, 10 : 1-6) 

TM : region transmembranaire prSdite (aa 1196-1218) avec le 
logiciel TMHMM v2.0 (Sonnhammer et al., 1998, Proc. of Sixth Int. Conf. on 
Intelligent Systems for Molecular Biology, p 175-182, AAAI Press). II faut noter que 
20 les acides amines W1194 et PI 195 font possiblement partie de la region trans- 
membranaire avec des probability respectives de 0,13 et 0,42. 

TK-L, TK-R : parties gauche et droite du gene de la thymidine 
kinase du virus de la vaccine 

MCS : site multiple de clonage 
25 PE : promoteur prScoce 

PL : promoteur tardif 

PL synth : promoteur tardif synthetique 480 

- la figure 35 illustre Texpression de la proline S par les virus 
vaccine recombinants, analyst par western blot. Des extraits cellulaires ont ete prepa- 
30 r6s 18 heures aprSs infection de cellules CV1 par les virus vaccine recombinants W- 
TG, VV-TG-S et W-TN-S k une M.O.I, de 2 (A). A titre de controle, des extraits de 
cellules VeroE6 ont 6t6 pr<5par<§s 8 heures aprds infection par le SRAS-CoV a une 



WO 2005/056781 



PCTVFR2004/003105 



43 

multiplicity d'infection de 2. Des extraits cellulaires ont ggalement ete pr6par<§s 18 
heures apres infection de cellules CV1 par les virus vaccine recombinants W-TG-S, 
W-TG-Ssol, VV-TN, VV-TN-S et W-TN-Ssol (B). lis ont 6te s6par<§s sur des gels 
SDS a 8% d'acrylamide et analyses par western blot k l'aide d'un anticorps polyclonal 
5 de lapin anti-S et d'un anticorps polyclonal anti-IgG(H+L) de lapin coupte a la 
peroxidase (NA934V, Amersham). « » et « lOjal » indique les quantity d'extraits 
cellulaires d6pos6es sur le gel. Une Schelle de masse molSculaire (kDa) est portee sur 
la figure. 

SRAS-CoV : extrait de cellules VeroE6 infectives par le SRAS-CoV 
10 Mock : extrait controle de cellules non infectees 

- la figure 36 montre le rSsultat d'une analyse par western blot de la 
secretion du polypeptide Ssol par les virus vaccine recombinants. 

A. Des surnageants de cellules CV1 infect^es par le virus vaccine 
recombinant W-TN, differents clones du virus W-TN-Ssol et par les virus VV-TG- 

15 Ssol ou W-TN-Sflag ont 6t6 recoltes 18 heures apres infection de cellules CV1 k une 
M.OJ. de 2. 

B. Des surnageants de cellules 293T, FRhK-4, BHK-21 et CV1 
infectees en dupliques (1,2) par le virus vaccine recombinant VV-TN-Ssol a une M 
.O.I. de 2 ont ete recoltes 18 heures apres infection. Le surnageant de cellules CV1 

20 infectees par le virus VV-TN a <§galement ete r6colt<§ k titre de contrdle (M). 

Tous les surnageants ont ete s^pares sur un gel SDS a 8% 
d'acrylamide selon Laemmli et analyses par western blot k Paide d'un anticorps 
monoclonal de souris anti-FLAG et d'un anticorps polyclonal anti-IgG(H+L) de souris 
couple k la peroxidase (NA931V, Amersham) (A) ou k l'aide d'un anticorps poly- 
25 clonal de lapin anti-S et d'un anticorps polyclonal anti-IgG(H+L) de lapin couple k la 
peroxidase (NA934V, Amersham) (B). 

Une echelle de masse moleculaire (kDa) est portee sur la figure. 

- la figure 37 montre l'analyse du polypeptide Ssol, purifie par gel 
SDS de polyacrylamide 

30 10, 5 et 2 fj.1 de polypeptide recombinant Ssol purifte par chromato- 

graphic d'affinite anti-FLAG ont <§te separ&s sur gel SDS en gradient de 4 a 15 % de 
polyacrylamide. Le polypeptide Ssol ainsi que des quantity variables de marqueurs de 
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SilverSNAP stain kit II, Pierce). 

- la figure 38 illustre l'immunoreactivite du polypeptide recombinant 
Ssol produit par le virus vaccine recombinant VV-TN-Ssol vis-a-vis de serums de 
5 patients atteints de SRAS. La r6activit<§ de scrums de patients a 6te analysee par test 
ELISA indirect contre des phases solides pr<§par6es k l'aide du polypeptide recombi- 
nant Ssol purifte. Les anticorps de patients r6agissant avec la phase solide a une 
dilution de 1/100 et 1/400 sont rdvetes par un anticorps polyclonal anti-IgG(H+L) 
humain coupte k la peroxidase (Amersham NA933V) et du TMB plus H202 (KPL). 

10 Les scrums de cas probables de SRAS sont identifies par un numero d'ordre du Centre 
National de RSfSrence des Virus Influenzae ainsi que par les initiales du patient et le 
nombre de jours ecoulSs depuis le debut des symptomes, le cas echeant. Les serums 
TV sont des scrums temoins de sujets qui ont 6t€ preleves en France avant l'6pidemie 
de SRAS survenue en 2003. 

15 - la figure 39 montre la rSponse en anticorps anti-SRAS-CoV chez la 

souris apr&s immunisation par les virus vaccine recombinants. Des groupes de 7 souris 
BALB/c ont ete immunises par voie i.v. a deux reprises a 4 semaines d'intervalle par 
106 u.f.p. de virus vaccine recombinants VV-TG, W-TG-HA, VV-TG-S, VV-TG- 
Ssol, W-TN, VV-TN-S, W-TN-Ssol. 

20 A. Des pools de serums immuns prgleves 3 semaines apres chacune 

des deux immunisations ont 6t6 realises pour chacun des groupes et ont et6 analyses 
par ELISA indirect en utilisant un lysat de cellules VeroE6 infect^es par le SRAS- 
CoV comme antigene. Les titres en anticorps anti-SRAS-CoV sont calcules comme 
Pinverse de la dilution produisant une DO sp£cifique de 0,5 apres revelation par un 

25 anticorps polyclonal anti-IgG de souris couple a la peroxidase (NA931V, Amersham) 
et du TMB (KPL). 

B. Les pools de serums immuns ont 6t6 6valu6s pour leur capacity k 
s6roneutraliser Pinfectivite de 100 TCID50 du SRAS-CoV sur cellules FRhK-4. 4 
points sont realises pour chacune des dilutions de raison 2 testes k partir du 1/20. Le 

30 titre s&roneutralisant est calculi selon la methode de Reed et Munsch comme Finverse 
de la dilution neutralisant Pinfectivite de 2 cupules sur 4. 
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- la figure 40 decrit la construction des virus recombinants 
MVSchw2-SARS-S et MVSchw2-SARS-Ssol. 

A. Le vecteur rougeole est un genome complet de la souche 
vaccinale Schwarz du virus de la rougeole (MV) dans lequel une unite de transcription 

5 supplemental a ete introduite (Combredet, 2003, Journal of Virology, 77 : 11546- 
11554). L'expression des phases ouvertes de lecture (ORF) suppiementaires est 
controlee par les Elements agissant en cis necessaires k la transcription, a la forma- 
tion de la coiffe et a la polyad&iylation du transgene, qui ont 6t6 copies des elements 
presents k la jonction N/P. 2 vecteurs differents permettent l'insertion entre les genes 
10 P (phosphoproteine) et M (matrice) d'une part et H (hemagglutinin) et L 
(polymerase) d' autre part. 

B. Les genomes recombinants MVSchw2-SARS-S et MVSchw2- 
SARS-Ssol du virus de la rougeole ont ete construits par 1' insertion des ORFs de la 
proteine S et du polypeptide Ssol au sein d'une unite de transcription supplemental 

1 5 localisee entre les genes P et M du vecteur. 

Les differents genes du virus de la rougeole (MV) sont indiques : N 
(nucteoproteine), PVC (phosphoproteine et proteine V/C), M (matrice), F (fusion), H 
(hemagglutinin), L (polymerase). T7 = promoteur de PARN polymerase T7, hh = 
ribozyme hammerhead, T7t = sequence terminatrice de TARN polymerase du phage 

20 T7, d « ribozyme du virus de Thepatite 5, (2), (3) = unites de' transcription supple- 
mentaires (ATU). 

Taille du genome du MV : 15894 nt. 

SP : peptide signal 

TM : region transmembranaire 
25 FLAG : etiquette FLAG 

- la figure 41 illustre Texpression de la proteine S par les virus 
rougeole recombinants, analysee par western blot. 

Des extraits cytoplasmiques ont ete prepares aprds infection de 
cellules Vero par differents passages des virus MVSchw2-SARS-S et MVSchw2- 
30 SARS-Ssol et le virus sauvage MWSchw a titre de controle. Des extraits cellulaires en 
tampon de depot selon Laemmli ont egalement ete prepares 8 heures aprds infection 
de cellules VeroE6 par le SRAS-CoV a une multiplicite d'infection de 3. lis ont ete 
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scares sur un gel SDS k 8% d'acrylamide et analyses par western blot k l'aide d'un 
anticorps polyclonal de lapin anti-S et d'un anticorps polyclonal anti-IgG(H+L) de 
lapin couple a la peroxidase (NA934V, Amersham). 

Une echelle de masse moteculaire (kDa) est port£e sur la figure, 
5 Pn : nieme passage du virus apr6s coculture de celMes 293-3-46 et 

Vero. 

SRAS-CoV : extrait de cellules VeroE6 infectees par le SRAS-CoV 
Mock : extrait controle de cellules VeroE6 non infectees 
- la figure 42 montre Texpression de la proteine S par les virus 
1 0 rougeole recombinants, analy see par immunofluorescence 

Des cellules Vero en monocouches sur lamelles de verre ont 6t6 
infectees par le virus sauvage MWSchw (A) ou les virus MVSchw2-SARS-S (B) et 
MVSchw2-SARS-Ssol (C). Quand les syncytia ont atteint 30 k 40% de confluence 
(A., B.) ou 90-100% (C), les cellules ont 6te fix6es, perm^abilisees et marquees par 
15 des anticorps polyclonaux de lapins anti-SRAS-CoV et un conjugue anti-IgG(H+L) de 
lapin couple au FITC (Jackson). 

la figure 43 illustre Tanalyse par western blot de 
Pimmunoreactivite de serums de lapins diriges contre les peptides El-12, E53-76 et 
M2-14. Le lapin 20047 a 6t6 immunise avec le peptide El-12 couple a la KLH. Les 
20 lapins 22234 et 22240 ont 6t€ immunises avec le peptide E53-76 couple k la KLH. Les 
lapins 20013 et 20080 ont 6t6 immunises avec le peptide M2-14 couple k la KLH. Les 
immunserums ont 6t6 analyses par western blot k Taide d'extraits de cellules infectees 
par le SRAS-CoV (B) ou k Taide d'extraits de cellules infectees par un virus recombi- 
nant de la vaccine exprimant la proteine E (A) ou M (C) de Pisolat 031589 du SRAS- 
25 CoV. Les immunoempreintes ont 6t6 rev616es k l'aide d'un conjugue anti-IgG(H+L) 
de lapin coupte a la peroxidase (NA934V, Amersham). 

La position des prolines E etM est indiquee par une fldche. 
Une Echelle de masse moteculaire (kDa) est portee sur la figure. 
II doit etre bien entendu, toutefois, que ces exemples sont donnas 
30 uniquement a titre d'illustration de l'objet de 1 'invention, dont ils ne constituent en 
aucune mantere une limitation. 
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Exemple 1 : Clonage et s£quen$age du genome de la souche de SARS-CoV issue 
du pr61&vement repertory sous le numero 031589 

L'ARN de la souche de SARS-CoV a ete extrait a partir du pr&e- 
vement de lavage bronchoalv^olaire r£pertorie sous le numero 031589, effectu6 sur un 
5 patient de Fhopital fran9ais de Hanoi (Vietnam) atteint de SRAS. 

L'ARN isote a &e utilise comme matrice pour amplifier les ADNc 
correspondant aux differents cadres ouverts de lecture du genome (ORF la, ORFlb, 
ORF-S, ORF-E, ORF-M, ORF-N (incluant les ORF-13 et ORF-14), ORF3, ORF4, 
ORF7 k ORF 11), et aux extr6mites 5' et 3' non-codantes. Les sequences des amorces 

10 et des sondes utilisees pour F amplification/detection ont 6t6 definies d'apr^s la 
sequence nucleotidique disponible du SARS-CoV. 

Dans ce qui suit les amorces et les sondes sont identifies par : la 
lettre S, suivie d'une lettre qui indique la region correspondante du genome (L pour 
Fextr6nit£ 5'incluant ORFla et ORFlb ; S, M et N pour les ORF-S, ORF-M, ORF-N, 

15 SE et MN pour les regions intergeniques correspondantes), puis eventuellement de Fn, 
Rn, avec n inclus entre 1 et 6 correspondant aux amorces utilisees pour la PCR nichee 
ou imbriquee (paire Fl + Rl pour la premiere amplification, paire F2 + R2 pour la 
deuxieme amplification, etc.. .), puis de /+/ ou /-/ correspondant a une amorce sens ou 
antisens et enfin des positions des amorces en reference a la sequence Genbank 

20 AY27411.3 ; pour les amorces S et N sens et antisens et les autres amorces sens 
uniquement, lorsqu'une seule position est indiqu6e elle correspond a celle de 
l'extr&nite 5 5 d'une sonde ou d'une amorce d'environ 20 bases ; pour les amorces 
antisens autres que les amorces S et N, lorsqu'une seule position est indiquee elle 
correspond a celle de l'extr&nit£ 3' d'une sonde ou d'une amorce d'environ 20 bases. 

25 Les produits d' amplifications ainsi g6n6x€s ont £te s6quenc£s & 

Faide d'amorces specifiques afin de determiner la sequence complete du genome de la 
souche de SARS-CoV issue du pretevement r6pertori6 sous le num6ro 031589. Ces 
produits d'amplification, a l'exception de ceux correspondant aux ORFla et ORFlb, 
ont ensuite ete clones dans des vecteurs d' expression afin de produire les proteines 

30 virales correspondantes et les anticorps dirig^s contre ces prot&nes, notamment par 
immunisation a base d' ADN. 
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1. Extraction des ARN 

Les ARN ont 6t6 extraits k Faide du kit QIamp viral RNA extraction 
mini (QIAGEN) en suivant les recommandations du fabricant. De mantere plus 
precise : 140 pi du preievement et 560 pi de tampon AVL ont ete melanges vigoureu- 
5 sement pendant 15 secondes, incubus 10 min k temperature ambiante puis centrifuges 
brievement a vitesse maximale. 560 jal d'ethanol a 100% ont ete ajoutes au surnageant 
et le melange ainsi obtenu a 6t6 agite tres vigoureusement pendant 15 sec. 630 pi du 
melange ont ensuite ete deposes sur la colonne. 

La colonne a ete plac£e sur un tube de 2 ml, centrifugee 1 min a 

10 8000 rpm, puis le reste du melange precedent a ete depose sur la m&me colonne, 
centrifuge a nouveau, 1 min a 8000 rpm et la colonne a ete transferee sur un tube de 2 
ml propre. Ensuite, 500 jjlI de tampon AW1 ont ete ajoutes sur la colonne, puis la 
colonne a 6te centrifugee 1 min a 8000 rpm et Peiuat a ete eiimine. 500 pi de tampon 
AW2 ont ete ajoutes sur la colonne qui a ensuite ete centrifugee 3 min a 14000 rpm et 

15 transferee sur un tube de 1,5 ml. Enfin, 60 pi de tampon AVE ont ete ajoutes sur la 
colonne qui a ete incubee 1 k 2 min a temperature ambiante puis centrifugee 1 min a 
8000 rpm. L'eiuat correspondant a TARN purifie a ete recupere et congeie a-20°C. 

2. Amplification, sequencage et clonage des ADNc 
2.1) ADNc codant pour la proteine S 

20 Les ARN extraits a partir du preievement ont ete soumis a une trans- 

cription inverse a Taide d'oligonucieotides hexameriques de sequence aieatoire 
(pdN6), afin de produire des fragments d'ADNc. 

La sequence codant pour la glycoproteine S du SARS-CoV a ete 
amplifiee sous la forme de deux fragments d'ADN chevauchants : fragment 5' 

25 (SRAS-Sa, SEQ ID NO:5) et fragment 3'(SRAS-Sb, SEQ ID NO:6), en realisant deux 
amplifications successives a 1'aide d'amorces imbriquees. Les amplicons ainsi obtenus 
ont ete sequences, clones dans le vecteur plasmidique PCR 2.1-TOPO™ (IN 
VITROGEN), puis la sequence des ADNc clones a ete determine^ 
a tolonage et sequencage des fragments Sa et Sb 

30 aO gXSftdSfi de.r.ADNc 

Le melange reactionnel contenant : ARN (5 pi) , H2O ppi (3,5 jol), 
tampon de transcriptase inverseSX (4 pi,), dNTP 5 mM (2 ^il), pdN6 100 ug/ml (4 pi), 
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RNasin 40 UI/ul (0,5 jlxI) et transcriptase inverse AMV-RT, 10 UI/ul, PROMEGA 
(1|lx1) a ete incube dans un thermocycleur dans les conditions suivantes : 45 min a 
42°C, 15 min a 55°C, 5 min k 95°C, puis PADNc obtenu a 6t6 maintenu k +4°C. 
a 2) premiere .^plification PCR 
5 Les extremites 5' et 3 3 du gdne S ont 6t6 amplifies respectivement 

avec les paires d'amorces S/F1/+/ 21350-21372 et S/Rl/-/ 23518-23498, S/F3/+/ 
23258-23277 et S/R3/-/253 82-25363. Le melange reactionnel de 50 jil contenant : 
ADNc (2 jil), amorces 50 \xM (0,5 ^1), tampon 10 X (5 fal), dNTP 5 mM (2 |ul), Taq 
Expand High Fidelity, Roche (0,75 jai) et H 2 0 (39, 75 nl) a ete amplify dans un 

10 thermocycleur, dans les conditions suivantes : une etape initiale de d&iaturation a 
94°C pendant 2 min a ete suivie de 40 cycles comprenant : une etape de denaturation a 
94°C pendant 30 sec, une etape d'hybridation a 55°C pendant 30 sec puis une etape 
d'elongation a 72°C pendant 2 min 30 sec, avec 10 sec d'elongation supplementaire k 
chaque cycle, puis d'une £tape finale d'elongation a 72°C pendant 5 min. 

1 5 a3) deimfeme .amphficati^ 

Les produits de la premiere amplification PCR (amplicons 5' et 3') 
ont subi une seconde etape d'amplification PCR (PCR nichee) dans des conditions 
identiques a celles de la premiere amplification, avec les paires d'amorces 
S/F2/+/21406-21426 et S/R2/-/23454-23435, et S/F4/+/23322-23341 et S/R4/-/25348- 

20 25329, respectivement pour Pamplicon 5' et Pamplicon 3'. 

Les amplicons Sa (extr&nit6 5') et Sb (extremite 3') ainsi obtenus ont 
&6 purifies a Paide du kit QIAquick PCR purification (QIAGEN), en suivant les 
recommandations du fabricant, puis ils ont et6 clones dans le vecteur PCR2.1-TOPO 

25 (kit Invitrogen), pour dormer les plasmides denonimes SRAS-S1 et SRAS-S2. 

L'ADN des clones Sa et Sb a 6t6 isolS puis Pinsert correspondant a 
6t6 sequence k Paide du Kit Big Dye, Applied Biosystem® et des amorces univer- 
selles M13 forward et M13 reverse, ainsi que des amorces: S/S/+/21867, 
S/S/+/22353, S/S/4-/22811, S/S/+/23754, S/S/+/24207, S/S/+/24699, S/S/+/24348, 

30 S/S/-/24209, S/S/-/23630, S/S/-/23038, S/S/-/22454, S/S/-/21815, S/S/-/24784, 
S/S/+/21556, S/S/+/23130 et S/S/+/24465, en suivant les instructions du fabricant ; les 
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sequences des fragments Sa et Sb ainsi obtenues correspondent aux sequences SEQ ID 
NO :5 et SEQ ID NO :6 dans la liste de sequences jointe en annexe. 

Le plasmide, denomme SARS-S1 a 6te depose sous le n° 1-3020, le 
12 mai 2003, aupres de la Collection Nationale de Cultures de Microorganismes, 25 
5 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient un fragment 5' de la 
sequence du gene S de la souche de SARS-CoV issue du prelevement repertorie sous 
le n° 031589, telle que definie ci-dessus, lequel fragment d6nomm6 Sa correspondant 
aux nucleotides des positions 21406 a 23454 (SEQ ID NO :5), en reference a la 
sequence Genbank AY2741 19.3 Tor2. 

10 Le plasmide, denomm£ TOP10F'-SARS-S2 a ete depose sous le n° 

1-3019, le 12 mai 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient un 
fragment 3'de la sequence du gene S de la souche de SARS-CoV issue du preleve- 
ment repertorie sous le n° 031589, telle que definie ci-dessus, lequel fragment 

15 denomm6 Sb correspondant aux nucleotides des positions 23322 a 25348 (SEQ ID 
NO : 6), en reference a la sequence Genbank n° d'accds AY2741 19.3. 
b"> clonage et sequenpage de T ADNc complet (clone SRAS-S de 4 kh) 

L'ADNc S complet a ete obtenu a partir des clones SARS-S1 et 
SARS-S2 precites, de la fa?on suivante : 

20 1) une reaction d' amplification PCR a ete realisee sur un clone 

SARS-S2 en presence de Tamorce S/R4/-/25348-25329 precitee et de l'amorce 
S/S/+/24696-24715: un amplicon de 633 pb a ete obtenu, 

2) une autre reaction d 5 amplification PCR a ete realisee sur un autre 
clone SARS-S2, en presence des amorces S/F4/+/23322-23341 precitee et S/SA 

25 /24803-24784: un amplicon de 1481 pb a ete obtenu, 

La reaction d'amplification a ete realisee dans les conditions telles 
que definies ci-dessus pour T amplification des fragments Sa et Sb, a Pexception que 
30 cycles d' amplifications comprenant une etape de denaturation a 94° C pendant 20 
sec et une etape d'eiongation a 72° C pendant 2 min 30 sec ont et6 effectues. 

30 3) les 2 amplicons (633 pb et 1481 pb) ont ete purifies dans les 

conditions telles que definies ci-dessus pour les fragments Sa et Sb. 
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4) une autre reaction d'amplification PCR a l'aide des amorces 
S/F4/+/23322-23341 et S/R4/-/25348-25329 precitees, a ete realisee sur les amplicons 
purifies obtenus en 3). La reaction d'amplification a 6te realisee dans les conditions 
telles que definies ci-dessus pour 1' amplification des fragments Sa et Sb, a l'exception 
que 30 cycles d' amplifications ont 6t6 effectues. 

L'amplicon de 2026 pb ainsi obtenu a ete purifie, clon<§ dans le 
vecteur PCR2.1-TOPO puis sequence comme ci-dessus, a l'aide des amorces telles 
que definies ci-dessus pour les fragments Sa et Sb. Le clone ainsi obtenu a ete 
d&iomme clone 3'. 

5) Le clone SARS-S1 pr<§cedemment obtenu et le clone 3 'ont ete 
dig6r<§s par EcoR I les bandes d'environ 2kb ainsi obtenues ont 6t6 purifi6es sur gel 
puis amplifiees par PCR avec les amorces S/F2/+/2 1406-2 1426 et S/R4/-/25348- 
25329 pr<§citees. La reaction d'amplification a 6t6 realisee dans les conditions telles 
que definies ci-dessus pour 1 'amplification des fragments Sa et Sb, a l'exception que 
30 cycles d' amplifications ont ete effectues. L'amplicon d'environ 4 kb a 6t6 purifie et 
sequence. II a ensuite &e clone dans le vecteur PCR2.1-TOPO pour dormer le 
plasmide, d&iomme SARS-S, et l'insert contenu dans ce plasmide a 6t6 sequence 
comme ci-dessus, 2l l'aide des amorces telles que definies ci-dessus pour les fragments 
Sa et Sb. Les sequences d'ADNc de l'insert et de l'amplicon codant pour la proteine 
S, correspondent respectivement aux sequences SEQ ID NO : 4 et SEQ ID NO : 2 
dans la liste de sequences jointe en annexe, elles codent pour la proteine S (SEQ ID 
NO : 3). 

La sequence de l'amplicon correspondant k l'ADNc codant pour la 
prot&ne S de la souche de SARS-CoV issue du pretevement n°031589 presente les 
deux mutations suivantes par rapport aux sequences correspondantes de respective- 
ment les isolats Tor2 et Urbani, les positions des mutations <§tant indiqudes en refe- 
rence a la sequence complete du genome de l'isolat Tor2 (Genbank AY2741 19.3) : 

- g/t en position 23220 ; le codon alanine (get) en position 577 de la 
sequence en acides amines de la proline S de Tor2 est remplace par un codon serine 
(tot), 

- c/t en position 24872 : cette mutation ne modifie pas la sequence 
en acides amines de la proteine S, et 
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Le plasmide, d&iomm6 SARS-S, a et6 d6pos6 sous le n° 1-3059, le 
20 juin 2003, auprSs de la Collection Nationale de Cultures de Microorganismes, 25 
rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient la sequence d'ADNc codant 
pour la proline S de la souche de SARS-CoV issue du prelevement r6pertorie sous le 

5 n° 031589, laquelle sequence correspondant aux nucleotides des positions 21406 k 
25348 (SEQ ID NO :4), en reference a la sequence Genbank AY2741 19.3. 
2.2) ADNc codant pour les prolines M et E 

Les ARN issus du prelevement 031589, extraits comme ci-dessus, 
ont 6te soumis k une transcription inverse, associ6e, lors de la meme 6tape (kit Titan 

10 One Step RT-PCR®, Roche), k une reaction ^amplification par PCR, a l'aide des 
couples d 5 amorces : 

- S/E/F1/+/2605 1-26070 et S/E/R1/-/26455-26436 pour amplifier l'ORF-E, et 

- S/M/F1/+/26225-26244 et S/M/R1/-/27 148-27 129 pour amplifier l'ORF-M. 

Un premier melange reactionnel contenant : 8,6 \il d'H20ppi, 1 |il de 
15 dNTP (5mM), 0,2 ^1 de chacune des amorces (50|aM), 1,25 ^1 de DTT (lOOmM) et 
0,25 |J.I de RNAsin (40UI/|ul) a ete combine avec un deuxieme melange reactionnel 
contenant : 1 \x\ d'ARN, 7 \x\ d'H 2 Oppi, 5 \il de tampon de RT-PCR 5X et 0,5 |al de 
melange d'enzyme et les melanges combines ont ete incubus dans un thermocycleur 
dans les conditions suivantes : 30 min a 42°C, 10 min a 55°C, 2 min a 94°C suivi de 
20 40 cycles comprenant une etape de denaturation k 94°C pendant 10 sec, une etape 
d'hybridation a 55°C pendant 30 sec et une etape d' Elongation a 68°C pendant 45 sec, 
avec 3 sec d'incr&nent par cycle et enfin une etape d'61ongation terminale k 68°C 
pendant 7 min. 

Les produits d'amplification ainsi obtenus (amplicons M et E) ont 
25 subi vine deuxteme amplification PCR (PCR nich^e) en utilisant le kit Expand High- 
Fi®, Roche), k l'aide des couples d'amorces : 

- S/E/F2/+/26082-26101 et S/E/R2/-/2641 3-26394 pour 1' amplicon E, et 

- S/M/F2/+/26330-26350 et S/M/R2/-/27098-27078 pour l'amplicon M. 

Le melange reactionnel contenant : 2 \xl du produit de la premiere PCR, 39,25 jul 
30 d'H 2 Oppi, 5 |Ltl de tampon 10X contenant du MgCl 2 > 2 jlxI de dNTP (5mM), 0,5^1 de 
chacune des amorces (50 \iM) et 0,75 \xl de melange d'enzyme a ete incube dans un 
thermocycleur dans les conditions suivantes : une £tape de denaturation k 94°C 
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pendant 2 min a ete suivie de 30 cycles comprenant une 6tape de denaturation a 94°C 
pendant 15 sec, une Etape d'hybridation a 60°C pendant 30 sec et une etape 
d' Elongation a 72°C pendant 45 sec, avec 3 sec d'increment par cycle, et enfin une 
Etape d'elongation terminale a 72°C pendant 7 min. Les produits d'amplification 

5 obtemis correspondant aux ADNc codant pour les proteines E et M ont ete sequences 
comme ci-dessus, a l'aide des amorces: S/E/F2/+/26082 et S/E/R2/-/26394, 
S/M/F2/+/26330, S/M/R2/-/27078 precit6es et des amorces S/M/+/2663 6-2665 5 et 
S/M/-/26567-26548. lis ont ensuite ete clones, comme ci-dessus, pour donner les 
plasmides denommes SARS-E et SARS-M. L'ADN de ces clones a ensuite ete isole et 

10 sequence a l'aide des amorces universelles M13 forward et M13 reverse ainsi que des 
amorces S/M/+/26636 et S/M/-/26548 precit6es. 

La sequence de ramplicon representant l'ADNc codant pour la 
proteine E (SEQ ID NO : 13) de la souche de SARS-CoV issue du prelevement 
n°031589 ne comporte pas de differences par rapport aux sequences correspondantes 

15 des isolats AY274119.3-Tor2 et AY278741-Urbani. La sequence de la prot6ine E de 
la souche de SARS-CoV 031589 correspond a la sequence SEQ ID NO : 14 dans la 
liste de sequences jointe en annexe. 

Le plasmide, denommE SARS-E a 6t6 depose" sous le n° 1-3046, le 
28 mai 2003, aupres de la Collection Nationale de Cultures de Microorganismes, 25 

20 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient la sequence d'ADNc codant 
pour la proteine E de la souche de SARS-CoV issue du pr61evement r6pertorie sous le 
n° 031589, telle que definie ci-dessus, laquelle sequence correspondant aux 
nucleotides des positions 26082 a 26413 (SEQ ID NO :15), en reference a la sequence 
Genbank n° d'acces AY2741 19.3. 

25 La sequence de ramplicon representant l'ADNc codant pour la M 

(SEQ ID NO : 16) de la souche de SARS-CoV issue du prelevement n°031589 ne 
comporte pas de differences par rapport a la sequence correspondante de l'isolat 
AY274119.3-Tor2. En revanche, en position 26857, l'isolat AY278741-Urbani 
comporte un c et la sequence de la souche de SARS-CoV issue du prelevement reper- 

30 toriE sous le n°03 1589 un t. Cette mutation aboutit a une modification de la sequence 
en acides amines de la proteine correspondante: en position 154, une proline 
(AY278741-Urbani) est changee en serine dans la souche de SARS-CoV issue du 
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pr£levement repertorie sous le n°031589. La sequence de la proteine M de la souche 
de SARS-CoV issue du pr&evement r<§pertori6 sous le n°031589 correspond a la 
sequence SEQ ID NO :17 dans la liste de sequences jointe en annexe. 

Le plasmide, denommS SARS-M a 6te depos£ sous le n° 1-3047, le 
5 28 mai 2003, auprds de la Collection Nationale de Cultures de Microorganismes, 25 
rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient la sequence d'ADNc codant 
pour la proline M de la souche de SARS-CoV issue du prelevement repertorie sous le 
n° 031589, telle que definie ci-dessus ; laquelle sequence correspondant aux 
nucleotides des positions 26330 a 27098 (SEQ ID NO :18), en reference k la sequence 

10 Genbanlc n° d'accSs AY2741 19.3, 

2.3) ADNc correspondant aux ORF3, ORF4, ORF7 h ORF11 

La meme strat£gie ^amplification, de clonage et de sequen?age a 6t6 
utilis£e pour obtenir les fragments d'ADNc correspondant respectivement aux ORF 
suivantes: ORF 3, ORF4, ORF7, ORF8, ORF9, ORF10 et ORF1L Les couples 

1 5 d'amorces utilises pour la premiere amplification sont : 

- ORF3 et ORF4 : S/SE/F1/+/25069-25088 et S/SE/R1/-/26300-26281 

- ORF7aORFll : S/MN/F1/+/26898-26917 et S/MN/R1/-/28287-28266 

Les couples d'amorces utilisees pour la deuxieme amplification sont : 

- ORF3 et ORF4 : S/SE/F2/+/25 1 10-25129 et S/SE/R2/-/26244-26225 
20 - ORF7aORFll : S/MN/F2/+/26977-26996 et S/MN/R2/-/282 18-281 99 

Les conditions de la premiere amplification (RT-PCR) sont les 
suivantes : 45 min a 42°C, 10 min k 55°C, 2 min k 94°C suivi de 40 cycles compre- 
nant une £tape de denaturation a 94°C pendant 15 sec, une 6tape d'hybridation a 58°C 
pendant 30 sec et une <§tape d'£longation k 68°C pendant 1 min, avec 5 sec d'incre- 

25 ment par cycle et enfin ime Stape d'&ongation terminale k 68°C pendant 7 min. 

Les conditions de la PCR nichee sont les suivantes : une 6tape de denaturation k 94°C 
pendant 2 min a 6X6 suivie de 40 cycles comprenant une 6tape de denaturation a 94°C 
pendant 20 sec, une 6tape d'hybridation a 58°C pendant 30 sec et une £tape 
d'elongation a 72°C pendant 50 sec, avec 4 sec ^increment par cycle et enfin une 

30 etape d'elongation terminale a 72°C pendant 7 min. 

Les produits d 5 amplification obtenus correspondant aux ADNc 
contenant respectivement les ORF3 et 4 et les ORF7 a 11 ont ete sequences a l'aide 
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des amorces: S/SE/+/25363, S/SE/+/25835, S/SE/-/25494, S/SE/-/25875, 
S/MN/+/27839, S/MN/+/27409, S/MN/-/27836 S/MN/-/27799 et clones comme ci- 
dessus povir les autres ORF, pour donner les plasmides denommes SARS-SE et 
SARS-MN. L'ADN de ces clones a ete isole et sequence a Paide de ces memes 
5 amorces et des amorces universelles Ml 3 sens et Ml 3 anti-sens. 

La sequence de Pamplicon representant PADNc de la region conte- 
nant les ORF 3 et 4 (SEQ ID NO :7) de la souche de SARS-CoV issue du prelevement 
n°031589 comporte une difference nucleotidique par rapport a la sequence corres- 
pondante de l'isolat AY2741 19-Tor2. Cette mutation en position 25298 aboutit a une 

10 modification de la sequence en acides amines de la proteine correspondante (ORF 3): 
en position 1 1, une arginine (AY2741 19-Tor2) est changee en glycine dans la souche 
de SARS-CoV issue du prelevement n°031589. En revanche, aucune mutation n'a ete 
identified par rapport a la sequence correspondante de l'isolat AY278741-Urbani. Les 
sequences des ORF 3 et 4 la souche de SARS-CoV issue du prelevement n°031589 

15 correspondent respectivement aux sequences SEQ ID NO :10 et 12 dans la liste de 
sequences jointe en annexe. 

Le plasmide, denomme SARS-SE a ete depose sous le n° 1-3126, le 
13 novembre 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15; il contient 

20 l'ADNc correspondant a la region situee entre PORF-S et PORF-E et chevauchant 
PORF-E de la souche de SARS-CoV issue du prelevement repertorie sous le n° 
031589, telle que definie ci-dessus, Iaquelle region correspondant aux nucleotides des 
positions 25110 a 26244 (SEQ ID NO :8), en reference a la sequence Genbank n° 
d'acces AY274119.3, 

25 La sequence de Pamplicon representant PADNc correspondant a la 

region contenant les ORF7 a ORF11 (SEQ ID NO :19) de la souche de SARS-CoV 
issue du prelevement n°031589 ne comporte pas de differences par rapport aux 
sequences correspondantes des isolats AY274119-Tor2 et AY278741-Urbani. Les 
sequences des ORF7 a 1 1 de la souche de SARS-CoV issue du prelevement n°03 1589 

30 correspondent respectivement aux sequences SEQ ID NO : 22, 24, 26, 28 et 30 dans la 
liste de sequences jointe en annexe. 
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Le plasmide denomme SARS-MN a ete depose sous le n° 1-3125, le 
13 novembre 2003, aupres de la Collection Nationale de Cultures de 
Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient la 
sequence d'ADNc correspondant a la region situee entre l'ORF-M et l'ORF-N de la 
5 souche de SARS-CoV issue du prelevement repertorte sous le n° 03 1 589 et prelevee a 
Hanoi, telle que definie ci-dessus, laquelle sequence correspondant aux nucleotides 
des positions 26977 a 28218 (SEQ ID NO :20 ), en reference a la sequence Genbank 
n° d'acces AY274 119.3. 

La sequence de l'amplicon repr6sentant l'ADNc correspondant a la 
10 region contenant les ORF7 a ORF11 (SEQ ID NO :19) de la souche de SARS-CoV 
issue du prelevement n°031589 ne comporte pas de differences par rapport aux 
sequences correspondantes des isolats AY274119-Tor2 et AY278741-Urbani. Les 
sequences des ORF7 a 1 1 de la souche de SARS-CoV issue du prelevement n°031589 
correspondent respectivement aux sequences SEQ ID NO : 22, 24, 26, 28 et 30 dans la 
1 5 Iiste de sequences jointe en annexe. 

2.4) ADNc codant pour la proteine N et incluant les ORF13 et ORF14 

L'ADNc a et6 synthefise et amplifie comme decrit ci-dessus pour les 
fragments Sa et Sb. De maniere plus precise, le melange reactionnel contenant : 5 pi 
d'ARN, 5 pi d'H 2 0 ppi 4 pi de tampon de reverse transcriptase 5X, 2 pi de dNTP (5 
20 mM), 2 pi d'oligo 20T (5 pM), 0,5 pi de RNasin (40 UI/ul) et 1 , 5 pi de AMV-RT (1 0 
UI/ul Promega) a €t€ incub£ dans un thermocycleur dans les conditions suivantes : 45 
min a 42°C, 1 5 min a 55°C, 5 min a 95°C, puis il a ete maintenu a +4°C. 

Une premiere amplification PCR a ele realisee avec la paire 
d'amorces S/N/F3/+/28023 et S/N/R3/-/29480. 
25 Le melange reactionnel comme ci-dessus pour 1' amplification des 

fragments SI et S2 a 6t6 incub6 dans un thermocycleur, dans les conditions suivantes : 
une etape initiale de denaturation a 94°C pendant 2 min a et6 suivie de 40 cycles 
comprenant une etape de denaturation a 94°C pendant 20 sec, une etape d'hybridation 
a 55°C pendant 30 sec puis une 6tape d'elongation a 72°C pendant 1 min 30 sec avec 
30 10 sec d'elongation supplementaire a chaque cycle, puis d'une etape finale 
d'elongation a 72°C pendant 5 min. 
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L'amplicon obtenu a la premiere amplification PCR a subi une 
seconde etape d' amplification PCR (PCR nich6e) avec la paires d'amorce 
S/N/F4/+/28054 et S/N/R4/-/29430 dans des conditions identiques k cellos de la 
premiere amplification. 
5 Le produit d' amplification obtenu correspondant a TADNc codant 

pour la proteine N de la souche de SARS-CoV issue du prelevement n°03 1589a ete 
sequence k l'aide des amorces: S/N/F4/+/28054, S/N/R4/-/29430, S/N/+/28468, 
S/N/+/28918 et S/N/-/28607 et clone comme ci-dessus pour les autres ORF, pour 
donner le plasmide denomm6 SARS-N. L'ADN de ces clones a ete isole et sequence k 

10 l'aide des amorces universelles M13 sens et M13 anti-sens, ainsi que des amorces 
S/N/+/28468, S/N/+/28918 et S/N/-/28607. 

La sequence de Tamplicon representant l'ADNc correspondant k 
l'ORF-N et incluant les ORF13 et ORF14 (SEQ ID NO :36) de la souche de SARS- 
CoV issue du prelevement n°031589 ne comporte pas de differences par rapport aux 

15 sequences correspondantes des isolats AY274119.3-Tor2 et AY278741-Urbani. La 
sequence de la proline N de la souche de SARS-CoV issue du prelevement n°031589 
correspond a la sequence SEQ ID NO : 37 dans la liste de sequences jointe en annexe. 

Les sequences des ORF13 et 14 de la souche de SARS-CoV issue du 
pretevement n°031589 correspondent respectivement aux sequences SEQ ID NO : 32 

20 et 34 dans la liste de sequences jointe en annexe. 

Le plasmide d6nomm<§ SARS-N a ete depose sous le n° 1-3048, le 5 
juin 2003, auprds de la Collection Nationale de Cultures de Microorganismes, 25 rue 
du Docteur Roux, 75724 Paris Cedex 15 ; il contient l'ADNc codant pour la proteine 
N de la souche de SARS-CoV issue du prelevement repertorie sous le n° 031589, telle 

25 que definie ci-dessus, laquelle sequence correspondant aux nucleotides des positions 
28054 k 29430 (SEQ ID NO :38), en reference a la sequence Genbank n° d'acces 
AY274119.3. 

2,5) extremity 5' et3' non-codantes 

a) extremite 5'non-codante (5'NC) 
30 ai) sxnthese de PADNc 

Les ARN issus du prelevement 031589, extraits comme ci-dessus, 
ont ete soumis a une transcription inverse dans les conditions suivantes : 
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L'ARN (15 et 1'amorce S/L/-/443 (3 jul h la concentration de 
5 jam, ont et£ incubus 10 min a 75°C. 

Ensuite, du Tampon de transcriptase inverse 5X (6 pi, 
INVITROGEN), des dNTP 10 mM (1 \x\\ du DTT 0,1M (3 jal) ont ete ajoutes et le 
5 melange a 6t6 incube a 50°C pendant 3 min. 

Enfin la transcriptase inverse (3 jutl de Superscript®, INVITROGEN) 
a 6t6 ajoutee au melange precedent qui a 6te incube & 50°C pendant lh30 puis a 90 °C 
pendant 2 min. 

L'ADNc ainsi obtenu a et6 purifie & l'aide du kit QIAquick PCR 

10 purification (QIAGEN), selon les recommandations du fabricant 
bi) Reaction hla Tenninal Transferase (TdT) 

L'ADNc (10 jj.1) est incub6 2 min a 100°C, conserve dans la glace, 
puis sont ajout6s : H 2 0 (2,5 tampon TdT 5X (4 \il 9 AMERSHAM), dATP 5mM 
(2 \x\) et TdT (1,5 jal, AMERSHAM). Le melange ainsi obtenu est incube 45 min a 

15 37°Cpuis2mina65°C. 

Le produit obtenu est amplifie par une premiere reaction PCR a l'aide 
des amorces : S/LA/225-206 et ancre 14T : 5'- 

AGATGAATTCGGTACCTTTTTTTTT^^ (SEQ ID NO :68). Les conditions 
de l'amplification sont les suivantes : une etape initiale de d&iaturation a 94°C 

20 pendant 2 min est suivie de 10 cycles comprenant une Etape de d&iaturation a 94°C 
pendant 10 sec, une Etape d'hybridation a 45°C pendant 30 sec puis une etape 
d' Elongation h 72°C pendant 30 sec puis de 30 cycles comprenant une Etape de dEna- 
turation a 94°C pendant 10 sec, une Etape d'hybridation h 50°C pendant 30 sec puis 
une Etape d' Elongation a 72°C pendant 30 sec, puis d'une Etape finale d'Elongation k 

25 72°C pendant 5 min. 

Le produit de la premiere amplification PCR a subi une seconde 
etape d'amplification a l'aide des amorces : S/L/-/204-185 et ancre 14T precise dans 
des conditions identiques a celles de la premiere amplification. L'amplicon ainsi 
obtenu a EtE purifie, sequence a l'aide de l'amorce S/L/-/182-163 puis il a EtE clonE 

30 comme ci-dessus pour les diffErentes ORF, pour donner le plasmide dEnommE SARS- 
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5'NC. L'ADN de ce clone a et6 isolS et s6quenc6 k Paide des amorces universelles 
M13 sens et M13 anti-sens et de P amorce S/L/-/182-163 pr6citee. 

L'amplicon repr6sentant PADNc correspondant k PextremitE 5'NC 
de la souche de SARS-CoV issue du pretevement rSpertorte sous le n° 031589 
5 correspond k la sequence SEQ ID NO : 72 dans la liste de sequences jointe en annexe ; 
cette sequence ne comporte pas de differences par rapport aux sequences 
correspondantes des isolats AY274119.3-Tor2 et AY278741-Urbani. 

Le plasmide denommE SARS-5'NC a <Ste depose sous le n° I- 3124, 
le 7 novembre 2003, aupr£s de la Collection Nationale de Cultures de 

10 Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient 
PADNc correspondant a Pextr6mite 5'non codante du g6nome de la souche de SARS- 
CoV issue du pr&evement r<§pertorie sous le n° 031589, telle que definie ci-dessus, 
laquelle sequence correspondant aux nucleotides des positions 1 a 204 (SEQ ID 
NO :39 ), en reference a la sequence Genbank n° d'acc£s AY2741 19.3. 

15 b) extremity 3 'non-codante (3'NC) 
ai) syntib^ge de PADNc 

Les ARN issus du pr61£vement 031589, extraits comme ci-dessus, 
ont ete soumis k une transcription inverse, selon le protocole suivant : le melange 
reactionnel contenant : ARN (5 |ul), H 2 0 (5 tampon de transcriptase inverse 5X (4 

20 jLtl), dNTP 5 mM (2 jal), Oligo 20T 5jaM (2 ^1), RNasin 40 U/ |xi (0,5 ^1) et RT-AMV 
10 UI/jxl (1,5 |nl, PROMEGA) a 6te incube dans un thermocycleur, dans les conditi- 
ons suivantes : 45 min k 42°C, 15 min a 55°C, 5 min a 95°C, puis il a 6te maintenu k 
+4°C. 

L'ADNc obtenu a 6t6 amplifte par une premiere reaction PCR a 
25 Paide des amorces S/N/+/28468-28487 et ancre 14T precitee. Les conditions de 
Pamplification sont les suivantes : une 6tape initiate de d6naturation k 94°C pendant 2 
min est suivie de 10 cycles comprenant une 6tape de d£naturation a 94°C pendant 20 
sec, une 6tape d'hybridation k 45°C pendant 30 sec puis une 6tape d' Elongation a 
72°C pendant 50 sec puis de 30 cycles comprenant une etape de d&iaturation a 94°C 
30 pendant 20 sec, une Etape d'hybridation k 50°C pendant 30 sec puis une 6tape 
d'elongation k 72°C pendant 50 sec, puis d'une Etape finale d'61ongation a 72°C 
pendant 5 min. 
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Le produit de la premiere amplification PCR a subi une seconde 
etape d' amplification a l'aide des amorces S/N/+/28933-28952 et ancre 14T pr6cit€e, 
dans des conditions identiques k celles de la premiere amplification. L'amplicon ainsi 
obtenu a ete purifie, sequence a l'aide de l'amorce S/N/+/29257-29278 et clone 
5 comme ci-dessus pour les diffSrentes ORF, pour donner le plasmide denommS SARS- 
3'NC. L'ADN de ce clone a ete isole et sequence a l'aide des amorces universelles 
M13 sens et M13 anti-sens et de l'amorce S/N/+/29257-29278 precitee. 

L'amplicon representant PADNc correspondant a l'extremite 3'NC 
de la souche de SARS-CoV issue du preievement repertorie sous le n° 031589 corres- 

10 pond a la sequence SEQ ID NO :73 dans la liste de sequences jointe en annexe ; cette 
sequence ne comporte pas de differences par rapport aux sequences correspondantes 
des isolats AY2741 19.3-Tor2 et AY278741-Urbani. 

Le plasmide d&iommS SARS-3'NC a ete depose sous le n° 1-3123 le 
7 novembre 2003, aupres de la Collection Nationale de Cultures de Microorganismes, 

15 25 rue du Docteur Roux, 75724 Paris Cedex 15. ; il contient la sequence d'ADNc 
correspondant k l'extremite 3'non codante du genome de la souche de SARS-CoV 
issue du preievement repertorie sous le n° 031589, telle que definie ci-dessus, laquelle 
sequence correspondant k celle situee entre le nucleotide en position 28933 a 29727 
(SEQ ID NO :40), en reference k la sequence Genbank n° d'acces AY274119.3, se 

20 termine par une serie de nucleotides a. 
2.6) ORFla et ORFlb 

L'amplification de la region 5* contenant les ORFla et ORFlb du 
genome du SARS-CoV issu du preievement 031589 a ete realisee en pratiquant des 
reactions de RT-PCR suivies de PCR nichees selon les memes principes que ceux 

25 precedemment decrits pour les autres ORF. Les fragments amplifies sont chevau- 
chants sur plusieurs dizaines de bases, permettant ainsi la reconstruction informatique 
de la sequence complete de cette partie du genome. En moyenne, les fragments ampli- 
fies sont de deux kilobases. 

14 fragments chevauchants denommes L0 a L12 ont ainsi ete 

30 amplifies a l'aide des amorces suivantes : 
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Tableau II ; Amorces utilisees pour l'amplification 
de la region 5'(ORFla et OKFlb) 



AMPLIFIEE 
ET 

SEQUENCEE 
(ne tient oas 
compte des 
amorces) 


Amorce sens 
RT-PCR 


Amorce antisens 
RT-PCR 


Amorce sens 
PCR nichee 


Amorce 
antisens PCR 
nichee 


L0 
50-480 


S/L0/F1/+30 


S/L0/R1/-481 






L1 

231-2240 


S/L1/F1/+147 


S/L1/R1/-2336 


S/L1/F2/+211 


S/L1/R2/-2241 


L2 

2156-4167 


S/L2/F1/+2033 


S/L2/R1/-4192 


S/L2/F2/+2136 


S/L2/R2A4168 


L3 

3913-5324 


S/L3bis/F1/+3850 


S/L3bis/R1/-5365 


S/L3bis/F2/+3892 


S/L3bis/R2/-5325 


L4b 
4952-6023 


S/L4b/F1/+4878 


S/L4b/R1/-6061 


S/L4b/F2/+4932 


S/L4b/R2/-6024 


L4 

5325-7318 


S/L4/F1/+5272 


S/L4/R1/-7392 


S/L4/F2/+5305 


S/L4/R2/-7323 


L5 

7296-9156 


S/L5/F1/+7111 


S/L5/R1/-9253 


S/L5/F2/+7275 


S/L5/R2/-9157 


L6 

9053-11066 


S/L6/F1/+8975 


S/L6/R1M1151 


S/L6/F2/+9032 


S/L6/R2/-11067 


L7 

10928-12962 


S/L7/F1/+10883 


S/L7/R1A13050 


S/L7/F2/+ 10928 


o/L / /rw£/-i zyoo 


L8 

12835-14834 


S/L8/F1/+12690 


S/L8/R1/-14857 


S/L8/F2/+12815 


S/L8/R2/-14835 


L9 

14765-16624 


S/L9/F1/+14688 


S/L9/R1/-16678 


S/L9/F2/+14745 


S/L9/R2/-16625 


L10 
16534-18570 


S/L10/F1/+16451 


S/L10/R1/-18594 


S/L10/F2/+16514 


S/L10/R2/-18571 


L11 
18521-20582 


S/L11/F1/+18441 


S/L11/R1/-20612 


S/L11/F2/+18500 


S/L11/R2/-20583 


L12 

| 20338-22205. 


S/L12/F1/+20279 


S/L12/R1 7-22229 


S/L12/F2/+20319 


S/L12/R2/-22206 



Tous les fragments ont et6 amplifies dans les conditions suivantes, 



excepte le fragment L0 qui a ete amplifie comme decrit ci-dessus pour l'ORF-M : 
5 - RT-PCR : 30 min a 42°C, 15 min a 55°C, 2 min a 94°C, puis 

l'ADNc obtenu est amplifie dans les conditions suivantes : 40 cycles comprenant : une 
etape de denaturation a 94°C pendant 15 sec, une etape d'hybridation a 58°C pendant 
30 sec puis une etape d'elongation a 68°C pendant 1 min 30 sec, avec 5 sec 
d'elongation supplementaire a chaque cycle, puis une etape finale d'elongation a 68°C 
10 pendant 7 min. 

- PCR nichee : une etape initiate de denaturation a 94°C pendant 2 
min est suivie de 35 cycles comprenant : une &ape de denaturation a 94°C pendant 15 
sec, une etape d'hybridation a 60°C pendant 30 sec puis une etape d'elongation a 
72°C pendant 1 min 30 sec, avec 5 sec d'elongation supplementaire a chaque cycle, 
1 5 puis une 6tape finale d'elongation a 72°C pendant 7 min. 
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Les produits d' amplifications ont 6t6 s6quenc6s k Taide des amorces 
d^finies dans le Tableau III ci-apres : 

Tableau III : Amorces utilisees pour le s6quen£age 
de la region 5' (ORFla et ORFlb) 



Noms 


Sequences (SEQ ID NO : 76 & 139) 


S/L3/+/4932 


5-CCACACACAGCTTGTGGATA-3' 


S/L4/+/6401 


5-CCGAAGTTGTAGGCAATGTC-3' 


S/L4/+/6964 


5'-TTTGGTGCTCCTTCTTATTG -3' 


S/L4/-/6817 


S'-CCGGCATCCAAACATAATTT-S' 


S/L5/-/7633 


5-TGGTCAGTAGGGTTGATTGG -3' 


S/L5/-/8127 


5'-CATCCTTTGTGTCAACATCG-3' 


S/L5/-/8633 


5'-GTCACGAGTGACACCATCCT-3' 


S/L5/+/7839 


5'-ATGCGACGAGTCTGCTTCTA-3' 


S/L5/+/8785 


5'-TTCATAGTGCCTGGCTTACC-3' 


S/L5/+/8255 


5*-ATCTTGGCGCATGTATTGAC-3' 


S/L6/-/9422 


5'-TGCATTAGCAGCAACAACAT-3' 


S/L6/-/9966 


5'-TCTGCAGAACAGCAGAAGTG-3' 


S/L6/-/10542 


5'-CCTGTGCAGTTTGTCTGTCA-3' 


S/L6/+/10677 


5'-CCTTGTGGCAATGAAGTACA-3* 


S/L6/+/10106 


5'-ATGTCATTTGCACAGCAGAA-3' 


S/L6/+/9571 


5'<;TTCAATGGTTTGCCATGTT-3' 


S/L7/-/11271 


5-TGCGAGCTGTCATGAGAATA-3' 


S/L7/-/11801 


5-AACCGAGAGCAGTACCACAG-3' 


S/L7/-/12383 


5'-TTTGGCTGCTGTAGTCAATG -3' 


S/L7/+/12640 


5'-CTACGACAGATGTCCTGTGC-3' 


S/L7/+/12088 


5'-GAGCAGGCTGTAGCTAATGG-3 ' 


S/L7/+/11551 


5'-TTAGGCTATTGTTGCTGCTG -3' 


S/L8/-13160 


5'-CAGACAACATGAAGCACCAC-3' 


S/L8/-/13704 


5'-CGCTGACGTGATATATGTGG-3' 


S/L8/-14284 


5'-TGCACAATGAAGGATACACC-3' 


S/L8/+/14453 


5'-ACATAGCTCGCGTCTCAGTT-3' 


S/L8/+/13968 


5'-GGCATTGTAGGCGTACTGAC-3' 


S/L8/+/13401 


5*-GTTTGCGGTGTAAGTGCAG-3' 


S/L9/-15098 


5'-TAGTGGCGGCTATTGACTTC-3' 


S/L9/-15677 


5'-CTAAACCTTGAGCCGCATAG-3' 


S/L9/-16247 


5 '-CATGGTCATAGCAGCACTTG-3 ' 




5 -CCAGGTTGTGATGTCACTGAT-3 


S/L9/+15858 


5'-CCTTACCCAGATCCATCAAG-3' 


S/L9/+15288 


5-CGCAAACATAACACTTGCTG-3' 


S/L10/-16914 


5'-AGTGTTGGGTACAAGCCAGT-3' 


S/L10/-17466 


5'-GTTCCAAGGAACATGTCTGG-3' 


S/L10/-18022 


5-AGGTGCCTGTGTAGGATGAA-3' 


S/L10/+18245 


5-GGGCTGTCATGCAACTAGAG-3' 


S/L10/+ 17663 


5'-TCTTACACGCAATCCTGCTT-3' 


S/L10/+17061 


5-TACCCATCTGCTCGCATAGT-3' 


S/L11/-/18877 


5'-GCAAGCAGAATTAACCCTCA-3' 


S/L11/-19396 


5'-AGCACCACCTAAATTGCATC-3' 


S/L11/-20002 


5'-TGGTCCCTTTGAAGGTGTTA-3' 


S/L11/+20245 


5'-TCGAACACATCGTTTATGGA-3' 


S/L11/+/19611 


5'-GAAGCACCTGTTTCCATCAT-3' 


S/L11/+/19021 


5-ACGATGCTCAGCCATGTAGT-3' 


SARS/L1/F3/+800 


5-GAGGTGCAGTCACTCGCTAT-3' 


SARS/L1/F4/+1391 


5-CAGAGATTGGACCTGAGCAT-3' 
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SARS/L1/F5/+1925 
SARS/L1/R3/-1674 
SARS/L1/R4/-1107 
SARS/L1/R5/-520 
SARS/L2/F3/+2664 
SARS/L2/F4/+3232 
SARS/L2/F5/+3746 
SARS/L2/R3/-3579 
SARS/L2/R4/-2991 
SARS/L2/R5/-2529 
SARS/L3/F3/+4708 
SARS/L3/F4/+5305 
SARS/L3/F5/+5822 
SARS/L3/R3/-5610 
SARS/L3/R4/-4988 
SARS/L3/R5/-4437 



5'-CAGCAAACCACTCAATTCCT-3' 

5'-AAATGATGGCAACCTCTTCA-3' 

5'-CACGTGGTTGAATG ACTTTG -3' 

5'-ATTTCTGCAACCAGCTCAAC-3' 

5'-CGCATTGTCTCCTGGTTTAC -3' 

5'-GAGATTGAGCCAGAACCAGA-3' 

5'-ATGAGCAGGTTGTCATGGAT-3* 

5'-CTGCCTTAAGAAGCTGGATG -3' 

5'-TTTCTTCACCAGCATCATCA-3' 

5'-CACCGTTCTTGAGAACAACC-3' 

5'-TCTTTGGCTGGCTCTTACAG -3' 

5'-GCTGGTGATGCTGCTAACTT-3' 

5'-CCATCAAGCCTGTGTCGTAT-3' 

5'-CAGGTGGTGCAGACATCATA-3' 

5-AACATCAGCACCATCCAAGT-3' 

5*-ATCGGACACCATAGTCAACG-3' 



Les sequences des fragments LO a L12 de la souche de SARS-CoV 
issue du prelevement repertorie sous le n° 031589, correspondent respectivement aux 
sequences SEQ ID NO :41 a SEQ ID NO :54 dans la liste de sequences jointe en 
5 annexe. Parmi ces sequences, seule celle correspondant aux fragments L5 comporte 
vine difference nucleotidique par rapport a la sequence correspondante de l'isolat 
AY278741-Urbani. Cette mutation t/c en position 7919 aboutit a une modification de 
la sequence en acides amines de la proteine correspondante, codee par l'ORF la: en 
position 2552, une valine (codon gtt ; AY278741) est changee en alanine (codon get) 
10 dans la souche de SARS-CoV 03 1 589. En revanche, aucune mutation n'a ete identifiee 
par rapport a la sequence correspondante de l'isolat AY274119.3-Urbani. Les autres 
fragments ne pr6sentent pas de differences par rapport aux sequences correspondantes 
des isolats Tor2 et Urbani. 

Exemnle 2 : Production et purification de proteines N et S recombinantes de la 
1 5 souche de SARS-CoV issue du prelevement repertorie sous le numero 031589 

La proteine entiere N et deux fragments polypeptidiques de la 
proteine S de la souche de SARS-CoV issue du prelevement repertorie sous le numero 
031589 ont et6 produites chez E. coli, sous forme de proteines de fusion comprenant 
une 6tiquette polyhistidine N-ou C-terminale. Dans les deux polypeptides S, les 
20 sequences hydrophobes N et C-terminales de la proteine S (peptide signal : positions 1 
a 13 et helice transmembranaire : positions 1196 a 1218) ont 6t6 deletees alors que 
l'helice P (positions 565 a 687) et les deux motifs de type coiled-coils (positions 895 a 
980 et 1155 a 1186) de la proteine S ont 6t6 preserves. Ces deux polypeptides sont 
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construes par : un fragment long (S L ) correspondant aux positions 14 a 1193 de la 
sequence en acides amines de la proline S et un fragment court (S c ) correspondant 
aux positions 475 a 1 193 de la sequence en acides amines de la proteine S. 
1) Clonage des ADNc N, S L et S c dans les vecteurs d'expression pIVEX2.3 et 
5 pIVEX2.4 

Les ADNc correspondant a la proteine N et aux fragments Sl et Sc 
ont ete amplifies par PCR dans des conditions standard, a l'aide de l'ADN polymerase 
Platinium Pfx® (INVITROGEN). Les plasmides SRAS-N et SRAS-S ont ete utilises 
comme matrice et les oligonucleotides suivants comme amorces : 

10 5 '-C CCATATG TCTGATAATGGACCCCAATC AAAC-3 ' (N sens, SEQ ID NO :55) 

5 ' -CCCCCGGGTGCCTG AGTTG AATC AGCAG AAGC-3 ' (N antisens, SEQ ID NO :56) 
5'-CCCATATGAGTGACCTTGACCGGTGCACCAC-3 ' (S c sens, SEQ ID NO :57) 
5'-CCCAIATGAAACCTTGCACCCCACCTGCTC-3' (S L sens, SEQ ID NO :58) 
5 '-CC CCCGGG TTTAATATATTGCTCATATTTTCCC -3 ' (S c et S L antisens, SEQ ID 

15 NO :59). 

Les amorces sens introduisent un site Ndel (souligne) alors que les 
amorces antisens introduisent un site Xmal ou Smal (souligne). Les 3 produits 
d'amplification on ete purifies sur colonne (kit QIAquickPCR Purification, QIAGEN) 
et clones dans un vecteur approprie. L'ADN plasmidique purifie des 3 constructions 

20 (kit QIAFilter Midi Plasmid, QIAGEN) a ete verifie par sequencage et digere par les 
enzymes Ndel et Xmal Les 3 fragments correspondants aux ADNc N, S L et S c ont ete 
purifies sur gel d'agarose puis inseres dans les plasmides pIYEX2.3MCS (etiquette 
polyhistidine C-terminale) et pIVEX2.4d (Etiquette polyhistidine N-terminale) preala- 
blement digeres par les memes enzymes. Apres verification des constructions, les 6 

25 vecteurs d'expressions ainsi obtenus (pIV2.3N, pIV2.3S c> pIV2.3S L , pIV2.4N, 
pIV2.4S c egalement denomme pIV2.4S h pIV2.4S L ) ont 6t6 ensuite utilises, d'une part 
pour tester l'expression des proteines in-vitro, et d'autre part pour transformer la 
souche bacterienne BL21(DE3)pDIA17 (NOVAGEN). Ces constructions codent pour 
des prolines dont la masse moleculaire attendue est la suivante : pIV2.3N (47174 

30 Da), pIV2.3Sc (82897 Da), pIV2.3S L (132056 Da), pIV2.4N (48996 Da), pIV2.4S, 
(81076 Da) et pIV2.4S L (133877 Da). Des bacteries transformees par pIV2.3N ont 6te 
deposees a la CNCM le 23 octobre 2003, sous le numero 1-3117, et des bacteries 
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transform6es par pIV2.4S! ont 6t€ deposees k la CNCM le 23 octobre 2003, sous le 
num£ro 1-3118. 

2) Analyse de P expression des proteines recombinantes in-vitro et in vivo 

L'expression de prolines recombinantes k partir des 6 vecteurs 
5 recombinants a 6t& test6e, dans un premier temps, dans un syst&me in-vitro (RTS100, 
Roche). Les prolines produites in vitro, apres une incubation des vecteurs recombi- 
nants pIVEX, 4h k 30°C, dans le systeme RTS100, ont ete analysees par western-blot 
k Paide d'un anticorps anti-(his) 6 couple k la peroxydase. Le resultat d'expression in- 
vitro (Figure 1) montre que seule la proteine N est exprim^e en quantites importantes, 

10 cela quelle que soit la position, N- ou C-terminale, de P etiquette polyhistidine. Dans 
une seconde etape, P expression des proteines N et S a ete testae in-vivo a 30°C dans 
du milieu LB, en presence ou en Pabsence d'inducteur (IPTG ImM). La proteine N 
est tres bien produite dans ce systfeme bacterien (Figure 2) et se retrouve principale- 
ment dans une fraction soluble apres lyse des bact&ies. En revanche, la version longue 

15 de S (S L ) est tres peu produite et complement insoluble (Figure 3). La version courte 
(Sc) presente ggalement ime tres faible solubilite, mais un taux d'expression beaucoup 
plus eleve que celui de la version longue. Par ailleurs, la construction Sc fiisionnee a 
une Etiquette polyhistidine en position C-terminale presente une taille plus faible que 
celle attendue. Une experience d'immunodetection avec un anticorps anti-poly- 

20 histidine a montre que cette construction 6tait incomplete. En conclusion, les deux 
constructions, pIV2.3N et pIV2.4Si, exprimant respectivement la proline N entiere 
fixsionnee k P etiquette polyhistidine en C-terminal et la proteine S courte fiisionnee k 
Petiquette polyhistidine en N-terminal, ont 6te retenues pour produire les deux 
proteines en grande quantite afin de les purifier. Les plasmides pIV2.3N et pIV2.4Si 

25 ont £te deposes respectivement sous le n° 1-3117 et 1-3118 aupres de la CNCM, 25 rue 
du Docteur Roux, 75724 PARIS 15, le 23 octobre 2003. 

3) Analyse de Pactivit6 antigenique des proteines recombinantes 

L'activite antigenique des prolines N, Sl et Sc a 6t6 testae par 
western-blot, k Paide de deux echantillons de serum, provenant d'un meme patient 
30 infecte par le SARS-CoV, pnSleves 8 jours (M12) et 29 jours-(M13) aprSs le debut des 
sympt6mes du SRAS. Le protocole experimental est comme decrit a Pexemple 3. Les 
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resultats illustres par la figure 4 montrent (i) la seroconversion du patient, et (ii) que la 
proline N possdde une plus forte reactivite antig^nique que la proline S courte. 

4) Purification de la proteine N a partir de pIV2.3N 

Plusieurs experiences de purification de la proteine N, produite a 
5 partir du vecteur pIV2.3N, ont ete r^alis^es selon le protocole suivant. Les bacteries 
BL21(DE3)pDIA17, transformees par le vecteur d'expression pIV2.3N, ont ete culti- 
vees a 30°C dans 1 litre de milieu de culture contenant 0,1 mg/ml d'ampicilline, et 
induites par 1 mM IPTG quand la density cellulaire, equivalente a Aeoo = 0,8, est 
atteinte (environ 3 heures). Apres 2 heures de culture en presence d'inducteur, les 

10 cellules ont ete recup6rees par centrifugation (10 min a 5000 rpm), remises en suspen- 
sion dans le tampon de lyse (50 mM NaH 2 P04, NaCl 0,3 M, 20 mM imidazole, pH 8 
contenant le melange d'inhibiteurs de proteases Complete® , Roche), et lysees par la 
presse de French (12000 psi). Apres centrifugation du lysat bacterien (15 min a 12000 
rpm), le surnageant (50 ml) a ete depose a un debit de lml/min sur une colonne (15 

15 ml) de chelation metallique (Ni-NTA superflow, Qiagen), equilibree par le tampon de 
lyse. Apres lavage de la colonne par 200 ml de tampon de lyse, la proteine N a ete 
eiuee par un gradient d'imidazole (20 -^250 mM) en 10 volumes de colonne. Les 
fractions contenant la proteine N ont ete rassembiees et analysees par eiectrophorese 
en gel de polyacrylamide en conditions denaturantes puis coloration au bleu de 

20 Coomassie. Les resultats illustres par la figure 5 montrent que le protocole employe 
permet de purifier la proteine N avec une homogeneite tres satisfaisante (95%) et un 
rendement moyen de 15 mg de proteine par litre de culture. 

5) Purification de la proteine S c & partir de pIV2.4S c (pIV2.4Si) 

Le protocole suivi pour purifier la proteine S courte est tres different 
25 de celui decrit ci-dessus car la proteine est fortement agregee dans le systeme bacte- 
rien (corps d'inclusion). Les bacteries BL21(DE3)pDIA17, transformees par le 
vecteur d'expression pIV2.4Si ont ete cultivees k 30°C dans 1 litre de milieu de 
culture contenant 0,1 mg/ml d'ampicilline, et induites par 1 mM IPTG quand la 
densite cellulaire, equivalente k A6oo - 0,8, est atteinte (environ 3 heures). Apr£s 2 
30 heures de culture en presence d'inducteur, les cellules ont ete recuperees par centrifu- 
gation (10 min k 5000 rpm), remises en suspension dans le tampon de lyse (0,1 M 
Tris-HCl, EDTA 1 mM, pH 7,5), et lysees par la presse de French (1200 psi). Apr£s 
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centrifugation du lysat bacterien (15 min a 12000 rpm), le culot a 6t6 remis en suspen- 
sion dans 25 ml de tampon de lyse contenant 2% Triton X100 et 10 mM (3- 
mercaptoethanol, puis centrifuge pendant 20 min a 12000 rpm. Le culot a ete remis en 
suspension dans un tampon Tris-HCl 10 mM contenant 7 M ur£e, et mis en agitation 
5 douce pendant 30 min & temperature ambiante, Ce dernier lavage des corps 
d'inclusion avec 7 M uree est necessaire pour eliminer la plupart des prolines 
membranaires d'E. coli qui co-sedimentent avec la proteine S c agregee. Apres une 
dernidre centrifugation pendant 20 min a 12000 rpm, le culot final est remis en 
suspension dans le tampon Tris-HCl 10 mM. 1/ analyse electrophoretique de cette 
10 preparation (Figure 6) montre que la proteine S courte peut etre purifiee avec une 
homogeneite satisfaisante (environ 90%) a partir des corps d'inclusion (extrait 
insoluble). 

Exemple 3 : Immunodominance de la proteine N 

La r6activit6 des anticorps presents dans le serum des patients 
15 atteints de pneumopathie atypique causae par le coronavirus associe au SRAS (SARS- 
CoV), vis-a-vis des difESrentes proteines de ce virus, a et£ analys6e par westem-blot 
dans les conditions decrites ci-aprfes. 
1) Materiel 

el) lvsat de cellules infect£es par le SARS-CoV 
20 Des cellules Vero E6 (2xl0 6 ) ont ete infectees par le SARS-CoV 

(isolat repertorie sous le numero FFM/MA104) a une multiplicity dMnfection (M.O.I.) 

de 10" 1 ou 10' 2 puis incubees dans du milieu DMEM contenant 2% de SVF, k 35°C 

dans une atmosphere contenant 5% de C0 2 . 48 heures plus tard, le tapis cellulaire a 

ete lave avec du PBS puis lyse avec 500 \x\ de tampon de depot prepare selon Laemmli 
25 et contenant du IJ-mercaptoethanol. Les echantillons ont ensuite ete bouillis 10 

minutes puis soniques 3 fois 20 secondes. 

b) anticorps 

b i ) serum v dej>atient 

Le serum reference au Centre National de Reference des virus 
30 influenzae (Region-Nord) sous le N° 20033168 est celui d'un patient fran9ais atteint 

d'une pneumopathie atypique causee par le SARS-CoV preieve au jour 38 apres le 
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debut des symptomes ; le diagnostic d'infection par le SARS-CoV a et<§ r6alis£ par 
RT-PCR nich£e et PCR quantitative. 
b 2 ) s6rams.j^^ 
ETPtdne S 

5 Les serums sont ceux produits a partir des proteines recombinantes N 

et S c (exemple 2), selon le protocole d'immunisation decrit a l'exemple 4 ; il s'agit du 
serum du lapin P13097 (serum anti-N) et du s6rum du lapin PI 1 135 (serum anti-S). 
2) MSthode 

20 jal de lysat de cellules infectees par le SARS-CoV a des M.O.I, de 

10 10" 1 et 10' 2 et, a titre de controle, 20 jul d'un lysat de cellules non infectees (mock) ont 
et6 s^pares sur un gel SDS k 10% de poly aery lamide puis transf6res sur une 
membrane de nitrocellulose. Apres blocage dans une solution de PBS/lait 5%/Tween 
0,1% et lavage en PBS/Tween 0,1%, cette membrane a et6 hybrids pendant une nuit 
a 4°C avec : (i) rimmun-serum N° 20033168 dilue au 1/300, 1/1000 et 1/3000 dans le 

15 tampon PBS/BSA 1%/Tween 0,1%, (ii) le s6rum du lapin P13097 (s6rum anti-N) 
dilu£ au 1/50000 dans le meme tampon et (iii) le serum du lapin PI 1135 (serum anti- 
S) dilu6 au 1/10000 dans le meme tampon. Apres lavage en PBS/Tween, une hybrida- 
tion secondaire a 6te realisee a Taide, soit d'anticorps polyclonaux de mouton diriges 
contre les chaines lourdes et tegeres des immunoglobulines G humaines et couples a la 

20 peroxidase (NA933V, Amersham), soit d'anticorps polyclonaux d'ane diriges contre 
les chaines lourdes et teg&res des immunoglobulines G de lapin et couples & la peroxi- 
dase (NA934V, Amersham). Les anticorps fixes ont 6t6 reviles k 1'aide du kit ECL+ 
(Amersham) et de films d' autoradiographic Hyperfilm MP (Amersham). Une Schelle 
de masse moleculaire (kDa) est portSe sur la figure. 

25 3) Resultats 

La figure 7 montre que trois polypeptides de masse moleculaire appa- 
rente 35, 55 et 200 kDa sont d6tect6s sp6cifiquement dans les extraits de cellules 
infectees par le SARS-CoV. 

Afin d'identifier ces polypeptides, deux autres immunoempreintes 
30 (figure 8) ont 6te r^alisdes sur les memes ^chantillons et dans les memes conditions 
avec des anticorps polyclonaux de lapins specifique de la nucleoprot&ne N (lapin 
P13097, figure 8A) et de la proteine de spicule S (lapin PI 1135, figure 8B) Cette 
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exp6rience montre que le polypeptide de 200 kDa correspond k la glycoprotein de 
spicule S du SARS-CoV, que le polypeptide de 55 kDa correspond k la nucteoprot&ne 
N tandis que le polypeptide de 35 kDa repr<§sente vraisemblablement une forme 
tronquee ou d6gradee de la N. 

5 Les donnSes presentees dans la figure 7 montrent done que le serum 

20033168 reagit fortement avec la N et beaucoup plus faiblement avec la S du SARS- 
CoV, puisque les polypeptides de 35 et 55 kDa sont rev61es sous la forme de bandes 
intenses pour des dilutions de 1/300, 1/1000 et 1/3000 de l'immunserum alors que le 
polypeptide de 200 kDa n'est que faiblement r6v61e pour une dilution de 1/300. On 

1 0 peut noter Sgalement qu'aucun autre polypeptide du SARS-CoV n'est detecte pour des 
dilutions superieures au 1/300 du s6rum 20033168. 

Cette experience indique que la r^ponse en anticorps sp6cifique de 
la N du SARS-CoV domine les reponses en anticorps spScifiques des autres poly- 
peptides du SARS-CoV et en particulier la reponse en anticorps dirigee contre la 

15 glycoprot6ine S. Elle indique une immunodominance de la nuclSoproteine N lors des 
infections humaines par le SARS-CoV. 

Exemple 4 : Preparation d' anticorps polyclonaux monospecifiques diriges contre 
les proteines N et S du coronavirus associe au SRAS (SARS-CoV) 
1) Materiel et methode 

20 Trois lapins (P13097, P13081, P13031) ont 6t6 immunises avec le 

polypeptide recombinant purifie correspondant k Pint6gralite de la nucleoproteine (N), 
prepare selon le protocole decrit k l'exemple 2. AprSs une premiere injection de 0,35 
mg par lapin de proline £mulsionnee en adjuvant complet de Freund (voie intra- 
dermique), les animaux ont re9us 3 injections de rappel a 3 puis 4 semaines 

25 d'intervalle, de 0,35 mg de proteine recombinante 6mulsionnee en adjuvant incomplet 
de Freund. 

Trois lapins (PI 1135, P13042, P14001) ont 6te immunises avec le 
polypeptide recombinant correspondant au fragment court de la proteine S (Sc), 
produit comme decrit k l'exemple 2. Comme ce polypeptide est retrouv6 principale- 
30 ment sous la forme de corps d'inclusion dans le cytoplasme bact&ien, les animaux ont 
re?us 4 injections intra-dermiques k 3-4 semaines d'intervalle d'une preparation de 
corps d'inclusion correspondant k 0,5 mg de prot&ne recombinante 6mulsionn6e en 
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adjuvant incomplet de Freund. Les 3 premieres injections ont <£te realisees avec une 
preparation de corps d'inclusion prepares selon le protocole decrit k l'exemple 2, 
tandis que la quatrieme injection a ete realised avec une preparation de corps 
d'inclusion qui ont 6t6 prepares selon le protocole decrit k l'exemple 2 puis purifies 
5 sur gradient de saccharose et lav£s en 2 % Triton XI 00. 

Pour chaque lapin, un s6rum pr6-immun (p.i.) a ete prepare avant la 
premiere immunisation et un immun-serum (I.S.) 5 semaines apres la quatrieme 
immunisation. 

Dans un premier temps, la r6activit6 des s6rums a 6t6 analysee par 
10 test ELISA vis k vis de preparations de proteines recombinantes semblables a celles 
utilisees pour les immunisations ; les tests ELISA ont 6X6 realises selon le protocole et 
avec les reactifs tels que decrits a l'exemple 6. 

Dans un deuxi&ne temps, la reactivity des s6rums a ete analyst en 
realisant une immunoempreinte (western blot) d'un lysat de cellules infectees par le 
1 5 SARS-CoV, en suivant le protocole tel que decrit k l'exemple 3 . 
2) Resultats 

Les tests ELISA (figure 9) demontrent que les preparations de 
proteine N recombinante et de corps d'inclusion du fragment court de la proteine S 
(S c ) sont immunogenes chez l'animal et que le titre des serums immuns est eleve (plus 
20 de 1/25000). 

L'immunoempreinte (figure 8) montre que le serum immun du lapin 
PI 3097 reconnait deux polypeptides presents dans les lysats de cellules infectees par 
le SARS-CoV : un polypeptide dont la masse moteculaire apparente (50-55 kDa selon 
les experiences) est compatible avec celle de la nucleoproteine N (422 r&idus, masse 

25 molSculaire predite de 46 kDa) et un polypeptide de 35 kDa, qui repr£sente vraisem- 
blablement ime forme tronquee ou ddgradee de la N. 

Cette experience montre 6galement que le s6rum du lapin PI 1135 
reconnait principalement un polypeptide dont la masse moteculaire apparente (180- 
220 kDa selon les experiences) est compatible avec vine forme glycosytee de la S 

30 (1255 r£sidus, chaJne polypeptidique non glycosytee de 139 kDa), ainsi que des poly- 
peptides plus legers, qui repr£sentent vraisemblablement des formes tronqu^es et/ou 
non glycosytees de la S. 
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En conclusion, P ensemble de ces experiences d&nontrent que des 
polypeptides recombinants exprintes chez E. colt et correspondant aux prolines N et 
S du SARS-CoV permettent d'induire chez l 5 animal des anticorps polyclonaux 
capables de reconnaitre les formes natives de ces proteines. 
5 Exemple 5 : Preparation d'anticorps polyclonaux monospecifiques diriges contre 
les proteines M et £ du coronavirus assocte au SRAS (SARS-CoV) 
1) Analyse de la structure des proteines M et E 

a) Proteine E 

La structure de la proline E du SARS-CoV (76 acides amines) a ete 
10 analyst in silico , k Paide de differents logiciels comme signalP vl.l, NetNGlyc 1.0, 
THMM 1.0 et 2.0 (Krogh et al., 2001, J. Mol. Biol., 305(3):567-580) ou encore 
TOPPRED (von Heijne, 1992, J. Mol. Biol, 225, 487-494). L'analyse montre que ce 
polypeptide non glycosyte est xme proteine membranaire de type 1, contenant une 
seule helice transmembranaire (aa 12-34 d'aprks THMM), et dont la plus grande partie 
15 du domaine hydrophile (42 r^sidus) est localisee a Pextremite C-terminale et vraisem- 
blablement a Pinterieur de la particule virale (endodomaine). On peut noter une inver- 
sion dans la topologie predite par les versions 1.0 (N-ter est externe) et 2.0 (N-ter est 
interne) du logiciel THMM, mais que d'autres algorithmes, notamment TOPPRED et 
THUMBUP (Zhou et Zhou, 2003, Protein Science 12 : 1547-1 555) confirment une 
20 localisation externe de P extremity N-terminale de E. 

b) Proline M 

Une analyse similaire r6alis6e sur la proline M du SARS-CoV (221 
acides amines) montre que ce polypeptide ne possfede pas de peptide signal (d'aprSs le 
logiciel signalP vl.l) mais trois domaines transmembranaires (r^sidus 15-37, 50-72, 

25 77-99 d'aprfcs THMM2.0) et un grand domaine hydrophile (aa 100-221) localise a 
Pinterieur de la particule virale (endodomaine). Elle est vraisemblablement glycosylee 
sur Pasparagine en position 4 (d'aprds NetNGlyc 1.0). 

Ainsi, en accord avec les dorutees experimentales connues pour les 
autres coronavirus, il est remarquable que les deux proteines M et E prdsentent des 

30 endodomaines correspondant k la majeure partie des polypeptides et des ectodomaines 
de tres petite taille. 
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- Tectodomaine de E correspond vraisemblablement aux residus 1 a 

11 ou 1 a 12 de la proline : MYSFVSEETGT(L), SEQ ID NO : 70. En effet, la 
probability assoctee a la localisation transmembranaire du r6sidu 12 est intermediate 
(0,56 d'aprds THMM 2.0). 

5 - Pectodomaine de M correspond vraisemblablement aux residus 2 a 

14 de la proteine : ADNGTITVEELKQ, SEQ ID NO : 69. En effet, la methionine N- 
terminale de M est trfes probablement clivee du polypeptide mature car le rSsidu en 
position 2 est une Alanine (Varshavsky, 1996, 93:12142-12149). 

Par ailleurs, l'analyse de l'hydrophobicite (Kyte & Doolittle, Hopp 
10 & Woods) de la proline E met en Evidence que P extremity C-terminale de 
l'endodomaine de E est hydrophile et done vraisemblablement expos^e a la surface de 
ce domaine. Ainsi, un peptide synthetique correspondant a cette extremity est un bon 
candidat immunogSne pour induire chez l'animal des anticorps dirig^s contre 
l'endodomaine de E. En consequence, un peptide correspondant aux 24 residus C- 
1 5 terminaux de E a 6t6 synth&ise. 

2) Preparation d'anticorps dirigls contre l'ectodomaine des proteines M et E et 
l'endodomaine de la proteine E 

Les peptides M2-14 (ADNGTITVEELKQ, SEQ ID NO : 69), El- 

12 (MYSFVSEETGTL, SEQ ID NO: 70) et E53-76 (KPTVYVYSRV 
20 KNLNSSEGVP DLLV, SEQ ID NO : 71) ont 6t6 synth&is6s par Neosystem. lis ont 

6t6 couples & la KLH (Keyhole Limpet Hemocyanin) a 1'aide du MBS (m-maleimido- 
benzoyl-N-hydroxysuccinimide ester) via une cysteine ajout^e au cours de la synthase 
soit en N-terminal du peptide (cas de E53-76) soit en C-terminal (cas de M2-14 et El- 
12). 

25 Deux lapins ont 6t6 immunises avec chacun des conjuguSs, en 

suivant le protocole d'imrnunisation suivant : apres ime premiere injection de 0,5 mg 
de peptide couple k la KLH et 6mulsionne en adjuvant complet de Freund (voie intra- 
dermique), les animaux re9oivent 2 a 4 injections de rappel a 3 ou 4 semaines 
d'intervalle de 0,25 mg de peptide coupl6 a la KLH et 6mulsionne en adjuvant 

30 incomplet de Freund. 
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Pour chaque lapin, un serum pr6-immun (p.i.) a 6t6 prepar6 avant la 
premiere immunisation et un immun-serum (I.S.) est prepare 3 a 5 semaines aprds les 
injections de rappel. 

La reactivity des s6rums a ete analys6e par western blot a l'aide 
5 d' extraits de cellules infectees par le SRAS-CoV (figure 43B) ou a l'aide d'extraits de 
cellules infectees par un virus recombinant de la vaccine exprimant la proteine E (W- 
TG-E, figure 43 A) ou M (VV-TN-M, figure 43C) de l'isolat 03 1589 du SRAS-CoV. 

Les immunserums des lapins 22234 et 22240, immunises par le 
conjugue KLH-E53-76, reconnaissent un polypeptide d'environ 9 a lOkD, qui est 

10 present dans les extraits de cellules infectees par le SRAS-CoV mais absent dans les 
extraits de cellules non infectees (figure 43B). La masse apparente de ce polypeptide 
est compatible avec la masse predite de la proteine E, qui est de 8,4 kD. De fa9on 
similaire, Fimmuns6rum du lapin 20047, immunise par le conjugue KLH-E1-12, 
reconnait un polypeptide present dans les extraits de cellules infectees par le virus 

15 VV-TG-E, dont la masse molaire apparente est compatible avec celle de la proteine E 
(figure 43A). 

L'immuns&um des lapin 20013 et 20080, immunises par le 
conjugu6 KLH-M2-14, reconnait un polypeptide present dans les extraits de cellules 
infectees par le virus VV-TN-M (figure 43 C), dont la masse molaire apparente (18 kD 
20 environ) est compatible avec celle de la glycoproteine M, qui est de 25,1 kD et 
presente un point iso61ectrique elev6 (9.1 pour le polypeptide nu). 

Ces resultats d&nontrent que les peptides El -12 et E53-76 d'une 
part et le peptide M2-14 d'autre part permettent d'induire chez Panimal des anticorps 
polyclonaux capables de reconnaitre les formes natives des proteines E et M 
25 respectivement du SRAS-CoV. 

Exemple 6 : Analyse de la reactivite en ELISA de la proteine N recombinante, 
vis-si-vis de serums de patients atteints de SRAS 

1) Materiel 

L'antigene utilise pour preparer les phases solides est la nucteo- 
30 prot&ne N recombinante puriftee pr6par6e selon le protocole d^crit k Texemple 2. 
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Les scrums a tester (Tableau IV) ont et6 choisis sur la base des 
r^sultats d'analyse de leur reactivite par immunofluorescence (titre IF-SRAS), vis-a- 
vis de cellules infectees par le SARS-CoV. 

Tableau IV : Serums testes en ELISA 

5 



R§ference 


N° serum 


Type 
de serum 


Date du 
Serum*** 


Titre IF-SRAS 


3050 


A 


Temoin 


na* 


nt** 


3048 


B 


Temoin 


na 


nt 


033168 


D 


Patient 1-SRAS 


27/04/03 (J38) 


320 


033397 


E 


Patient-1 SRAS 


11/05/03 (J52) 


320 


032632 


F 


Patient-2 SRAS 


21/03/03 (J 17) 


2500 


032791 


G 


Patient-3 SRAS 


04/04/03 (J3) 


<40 


033258 


H 


Patient-3 SRAS 


28/04/03 (J27) 


160 



*na : non-applicable. ** nt : non-teste. *** les dates indiqu^es correspondent ail nombre de 
jours apr&s le d6but des symptomes de SRAS. 

2) Methode 

10 La proline N (100 jul) diluee k diffSrentes concentrations dans du 

tampon carbonate 0 5 1 M, pH 9,6 (1, 2 ou 4 ^ig/ml) est distribute dans les puits de 
plaques ELISA, puis les plaques sont incubees une nuit a temperature du laboratoire. 
Les plaques sont lavees avec du tampon PBS-Tween, saturees avec du tampon PBS- 
lait tcremt-saccharose (5 %). Les serums a tester (100 jal) prealablement dilues (1/50, 

15 1/100, 1/200, 1/400, 1/800, 1/1600 et 1/3200) sont ajoutes, puis les plaques sont incu- 
bees 1 h k 37° C. AprSs 3 lavages, le conjugue anti-IgG humaines marque k la peroxy- 
dase (reference 209-035-098, JACKSON) dilue au 1/18000 est ajoute puis les plaques 
sont incub£es lh k 37 °C. Aprds 4 lavages, le chromog£ne (TMB) et le substrat (H 2 0 2 ) 
sont ajoutes et les plaques sont incubees 30min k temperature ambiante, a Pabri de la 

20 lumiere. La reaction est ensuite arretee puis Pabsorbance a 450 nm est mesuree a 
Paide d'un lecteur automatique. 

3) R&ultats 

Les tests ELISA (figure 10) demontrent que la preparation de 
proteine N recombinante est reconnue specifiquement par les anticorps de serums de 
25 patients atteints de SRAS preleves en phase tardive de l'infection (> 17 jours aprds le 
debut des symptomes) alors qu'elle n'est pas reconnue de fa?on significative par les 
anticorps d'un serum de patient preieve en phase precoce de Pinfection (3 jours apres 
le debut des symptomes) ni par des serums temoins de sujets non atteints de SRAS. 
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Exemple 7 : Tests ELISA £Iabor6s pour une detection tres sp£cifique et sensible 
d'une infection par le coronavirus assocte au SRAS, a partir de serums de 
patients 

1) Test ELISA IgG indirect 

5 

a) Riactifs 

Preparation des plagues 

10 Les plaques sont sensibilis£es par une solution de proteine N a 

2jLig/mL dans un tampon PBS lOmM pH 7,2, rouge de ph&iol k 0,25mL /L. 100 pL de 
solution sont deposes dans les puits et laisses incubes a temp6rature ambiante pendant 
une nuit. La saturation se fait par un prelavage en tampon PBS lOmM / tween 0,1%, 
suivi d'un lavage avec xme solution de saturation PBS, 25% lait /saccharose. 

1 5 Diluant serums 

Tampon TRIS 0,48g/L, PBS lOmM, EDTA 3,7g/L,lait 15% v/v , pH 

6,7 

Diluant conjugue 

Tampon citrate (15g/L), tween 0,5% , serum bovin 25%, NaCl 12%, 
20 lait ecrem6 6% v/v PH 6,5 
Conjugue 

Conjugu6 anti-IgG humaines 50X, commercialises par Bio-Rad : kit 
Platelia H. pylori ref 72778 
Autres solutions : 

25 Solution de lavage R2, Solutions de revelation au TMB R8 diluant, 

R9 chromogSne, R10 solution d'arrSt : r^actifs commercialises commercialis^es par 
Bio-Rad (ex : kit Platelia pylori, ref 72778) 

b) Mode opgratoire 

Diluer les serums au 1/200 dans le diluant £chantillons 
30 Distribuer 1 00|aL/puits 

Incubation lh a 37°C 

3 lavages en solution de LAVAGE R2 lOx prealablement diluee 10 
fois en eau demin6ralis6e (Le. 9 solution de lavage IX) 
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Distribuer IOOjxL de conjugue (conjugue 50x a diluer 
extemporan&nent dans le diluant conjugue fourni) 

Incubation lh a 37°C 

4 lavages en solution de lavage IX 
5 distribuer 200jiL/puits de solution de r£v61ation (k diluer 

extemporanement ex:l mL de R9 dans lOmL de R8) 

Incubation 30 min a temperature ambiante k l ! obscurit6 

arreter la reaction avec lOOjiL/puits de RIO 

LECTURE k 450/620nm 
10 Les r£sultats peuvent etre interpr&es en prenant un serum SEUIL 

donnant une reponse au dela de laquelle les serums testes seront consideres comme 
positifs. Ce serum est choisi et dilue de fa9on a donner un signal significativement 
superieur au bruit de fond. 
2) Test ELISA DOUBLE EPITOPE 

15 

a) Reactifs 

Preparation des plaques 

20 Les plaques sont sensibilisees par une solution de proteine N a 

ljxg/mL dans un tampon PBS lOmM pH 7,2, rouge de phenol a 0,25mL /L. 100 \ih de 
solution sont deposes dans les puits et laisses incubes a temperature ambiante pendant 
une nuit La saturation se fait par un pr£lavage en tampon PBS lOmM / 0,1% tween 
suivi d'un lavage avec une solution de saturation PBS lOmM, lait 25% (V/V) 

2 5 Diluant serums et conjugue 

Tampon TRIS saline 50mM pH8, lait 2% 

Conjugue 

II s'agit de la prot&ne N recombinante purifiee, coupl^e k la 
peroxidase selon le protocole de Nalcane (Nakane P.K. and Kawaoi A; (1974) : 
30 Peroxydase-labeled antibody, a new method of conjugation. The Journal of 
Histochemistiy and Cytochemistry Vol22, N)23, pp 1084-1091.), dans des ratios 
molaires respectifs 1/2. Ce conjugue ProtN POD est utilise k une concentration de 
2|ag/mL dans du diluant serum/conjugu£. 
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Autres solutions : 

Solution de lavage R2, Solutions de relation au TMB R8, diluant , 
R9 chromogene, RIO solution d' arret : reactifs commercialisees par Bio-Rad (ex kit 
platelia pylori ref 72778). 

5 

V) Mode opdratoire 

lere etape en plaque de "predilution" 

■ Diluer chaque serum au 1/5 dans la plaque de predilution (48 jxL de diluant +12 
10 |j.L de serum). 

■ Apres avoir dilues Tensemble des serums, distribuer 60|iL de conjugue 

■ Le cas echeant, le melange serum + conjugue est laiss6 a incuber. 

2eme etape en plaque de "reaction" 
15 ■ Transferer 100(iLde meiange/puits dans la plaque de reaction 
Incubation lh 37°C 

■ 5 lavages en solution de LAVAGE R2 lOx prealablement dilu6e 10 fois en eau 
d&nineralisee (~ > solution de lavage lx) 

■ distribuer 200^L/puits de solution de revelation (a diluer extemporan&nent ex:l 
20 mL de R9 dans 1 OmL de R8) 

■ incubation 30min a temperature ambiante a l'abri de la lumtere 

■ arrSter la reaction avec 100|xL/puits de R10 

■ LECTURE a 450/620nm 

De mSme que pour le test ELISA indirect, les r£sultats peuvent etre 
25 interprets en utilisant un serum "valeur seuil". Tout serum ay ant une reponse 
superieure au serum valeur seuil sera consider comme positif. 
2) Resultats 

Les serums de patients classes comme cas probables de SRAS de 
Fh6pital fran9ais de Hanoi, Vietnam ou en relation avec Phopital fran9ais de Hanoi 
30 (JYK) ont ete analyses en utilisant le test IgG-N indirect et le test N double epitope. 

Les resultats du test IgG-N indirect (figures 14 et 15) et N double 
epitope (figures 16 et 17) montrent une excellente correlation entre eux ainsi qu'avec 
un test ELISA indirect comparant la reactivite des serums vis-a-vis d'un lysat de 
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cellules VeroE6 non infectees ou infect6es par le SRAS-CoV (ELISA-lysat SRAS- 
CoV ; voir le Tableau V ci-apr6s). Tous les scrums pr61ev6s 12 jours ou plus apr£s le 
d6but des symptomes ont 6t6 trouves positifs, y compris chez des patients pour 
lesquels l'infection par le virus du SRAS-CoV n'avait pas pu etre documents par 

5 analyse de pr61evements respiratoires par RT-PCR, vraisemblablement en raison d'un 
pr61evement trop tardif au cours de Pinfection (> J12). Dans le cas du patient TTH 
pour lequel un pr61evement nasal realist a J7 a 6te trouve negatif par RT-PCR, la 
qualite du pr61Svement pourrait §tre en cause. 

Certains scrums ont 6t6 trouves n6gatifs alors que la presence de 

10 SRAS-CoV a 6te detect<§e par RT-PCR. II s'agit dans tous les cas de scrums pr^coces 
pr&eves moins de 10 jours apres le debut des symptomes (ex : s£rum # 032637). Dans 
le cas d'un patient PTTH (s6rum # 032673), seule une suspicion de SRAS etait 
evoqu£e au moment oix les pr61evements ont €\€ r6alis6s. 

En conclusion, les tests s6rologiques IgG-N indirect et N-double 

15 epitope permettent de documenter Pinfection par le SRAS-CoV chez tous les patients 
pour des serums prelev^s 12 jours ouplus apres Pinfection. 



Tableau V : Resultats des tests ELISA 



Num Pvt 


Patient 


Jour 


PCR-SARS 
(D 


ELISA 
lysat 
SRAS- 
CoV (2) 


IgG-N 
(2 6me serle) 


2Xepitope 
(2* me serie) 


033168 


JYK 


38 


POS 


+++ 


>5000 


NT 


033597 


JYK 


74 


POS 


NT 


~ 5000 


NT 


032552 


VTT 


8 


NEG- 
J3&J8&J12 


NEG 


<200 


<5 


032544 


CTP 


16 


NEG 
J16&J20 


++ 


>5000 


»20 


032546 


CJF 


15 


NEG 
J15&J19 


++ 


>5000 


»20 


032548 


PTL 


17 


NEG 
J17&J21 


++ 


>5000 


»20 


032550 


NTH 


17 


NEG-J17&J21 


++ 


>5000 


»20 


032553 


VTT 


8 


NEG- 

J3&J8&J12 


NEG 


<200 


<5 


032554 


NTBV 


4 


POS 


NEG 


<200 


<5 


032555 


NTBV 


4 


POS 


NEG 


<200 




032564 


NTP 


15 


POS 


++ 


>5000 


»20 


032629 


NVH 


4 


POS 


NEG 


<200 


<5 


032631 


BTTX 


9 


POS 


NEG 


<200 


<5 


032635 


NHH 


4 


POS 


NEG 


<200 


<5 


032637 


NHB 


10 


POS 


NEG 


<200 


<5 


032642 


BTTX 


9 


POS 


NEG 


<200 


<5 
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032643 


LTDH 


1 


POS 


NEG 


<200 


<5 


032644 


NTBV 


A 


"wo 


IN CO 




<5 


032646 


TTH 


12 


NEG 

l~7& MO& Hfi 


++ 


>5000 


»20 


032647 


DTH 


1 "7 
I ( 


INtb 

J17&J21 


TT 


>oooo 


»20 


032648 


NNT 




IN to 

J16&J19 


.1, ,1, 
IT 




»20 


032649 


PTH 




INCO 

J17&J21 


TT 


scnnn 
^OUUU 




032672 


LW 


16 


NEG 
J16&J20 


+ 


>5000 


»20 


032673 


PTTH 


NA 


NEG 


NEG 


<200 


<5 


032674 


PNB 


17 


NEG 
J17&J21 


++ 


>5000 


»20 


032682 


VTH 


12 


NEG 
J12&J16 


++ 


>5000 


»20 


032683 


DTV 


17 


NEG 
J17&J21 


+ 


>1000 


»20 



Notes: 



(1) : Les analyses par RT-PCR ont ete realisees par RT-PCR nichee BNI, LC Artus et 
LC-N sur des ecouvillonnages nasaux ou pharynges; POS signifie qu'au moins un 
prelevement a 6t6 trouve positif chez ce patient. 

(2) : La reactivity des serums dans le test ELISA utilisant un lysat de cellules infectees 
par le SRAS-CoV a ete classee en tres fortement reactif (+++), fortement reactif (++), 
reactif (+) et negatif en fonction de la valeur DO obtenue aux dilutions testees 
Example 8 : Detection du coronavirus associe au SRAS (SARS-CoV) par RT- 
PCR 

1) Mise au point de conditions de RT-PCR en temps reel a l'aide d'amorces 
specifiques du gfcne de la proteine de nucleocapside - test "Light Cycler N" 

a) conception des amorces et des sondes 

La conception des amorces et sondes a €t€ rdalisee a partir de la 
sequence du genome de la souche de SARS-CoV issue du prelevement repertory sous 
le numero 031589, a l'aide du programme "Light Cycler Probe Design (Roche)". 
Ainsi les deux series d'amorces et de sondes suivantes ont ete selectionn6es : 



- serie 1 (SEQ ID NO : 60, 61, 64, 65): 

- amorce sens : N/+/28507 : 5'-GGC ATC GTA TGG GTT G-3' [28507-28522] 

- amorce antisens : N/-/28774 : 5'-CAG TTT CAC CAC CTC C-3' [28774-28759] 

- sonde 1 : 5'-GGC ACC CGC AAT CCT AAT AAC AAT GC-fluoresceine 3' I 
28586] 
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- sonde 2 : 5' Red705 -GCC ACC GTG CTA CAA CTT CCT-phosphate [28588-28608] 

- s£rie2 (SEQ ID NO : 62, 63, 66, 67) 

- amorce sens : N/+/28375 : 5 9 -GGC TAC TAC CGA AGA G-3' [28375-28390] 

- amorce antisens : N/-/28702 : 5'-AAT TAC CGC GAC TAC G-3' [28702-28687] 

5 - sonde 1 : SRAS/N/FL : 5'-ATA CAC CCA AAG ACC ACA TTG GC - fluorescein 3' 
[28541-28563] 

- sonde 2 : SRAS/N/LC705 : 5 5 Red705 -CCC GCA ATC CTA ATA ACA ATG CTG C- 
phosphate 3' [28565-28589] 

10 b) analyse de Tefficacite des deux couples amorces 

Afin de tester l'efficacite respective des deux couples d f amorces, une 
amplification par RT-PCR a 6te r^alisee sur un ARN synthetique correspondant aux 
nucleotides 28054-29430 du genome de la souche de SARS-CoV issue du preleve- 
ment repertorie sous le num£ro 03 1589et contenant la sequence du gene N. 

1 5 De mantere plus precise : 

Cet ARN synthetique a ete prepare par transcription in vitro a l'aide 
de TARN polymerase du phage T7, d ! une matrice d f ADN obtenu par linearisation du 
plasmide SRAS-N avec l'enzyme Bam HI. Apr£s elimination de la matrice d'ADN par 
digestion k l'aide de DNAse 1, les ARN synthetiques sont purifies par une extraction 

20 au phenol-chloroforme suivie de deux precipitations successives en acetate 
d'ammonium et isopropanol. lis sont alors quantifies par mesure de Tabsorbance h 260 
nm et leur qualite est controiee par le rapport des absorbances a 260 et 280 nm ainsi 
que par une eiectrophordse en gel d'agarose. Ainsi, la concentration de la preparation 
d'ARN synthetique utilisee pour ces etudes est de 1,6 mg/ml, ce qui correspond a 

25 2,1. 10 15 copies/ml d'ARN. 

Des quantites decroissantes d ! ARN synthetique ont ete amplifies par 
RT-PCR a Taide du kit "Superscript™ One-Step RT-PCR with Platinum® Taq" et les 
couples d'amorces n° 1 (N/+/28507, N/-/28774) (figure 1A) et n° 2 (N/+/28375, NA 
/28702) (figure IB), en suivant les indications du fournisseur. Les conditions d f ampli- 
30 fication utilisees sont les suivantes : TADNc a ete synthetise par incubation 30 min a 
45 °C, 15 min a 55°C puis 2 min & 94 °C puis il a ete amplifie par 5 cycles compre- 
nant : une etape de denaturation a 94°C pendant 15 sec, une etape d'hybridation a 
45°C pendant 30 sec puis une etape d'eiongation a 72°C pendant 30 sec, suivis de 35 
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cycles comprenant : une etape de denaturation a 94°C pendant 15 sec, une etape 
d'hybridation a 55°C pendant 30 sec puis une etape d'elongation a 72°C pendant 30 
sec, avec 2 sec d' elongation supplemental a chaque cycle, et d'une etape finale 
d'elongation a 72°C pendant 5 min. Les produits d'amplification obtenus ont ensuite 

5 ete maintenus a 10°C. 

Les resultats presentes a la figure 11 montrent que le couple 
d'amorces n° 2 (N/+/28375, N/-/28702) permet de d6tecter jusqu'a 10 copies d'ARN 
(bande de faible intensite) ou 10 2 copies (bande de bonne intensity contre 10 4 copies 
pour le couple d'amorces n° 1 (N/+/28507, N/-/28774). Les amplicons sont respecti- 

10 vement de 268 pb (couple 1) et de 328 pb (couple 2). 

c) mise au point de la RT-PCR en temps reel 

Une RT-PCR en temps reel a ete mise au point a l'aide du couple 
d'amorces n°2 et du couple de sonde consume par SRAS/N/FL et SRAS/N/LC705 
(figure 2). 

15 L'amplification a ete realisee sur un LightCycler™ (Roche) a l'aide 

du kit "Light Cycler RNA Amplification Kit Hybridization Probes " (reference 2 015 
145, Roche) dans les conditions optimisees suivantes. Un Melange reactionnel conte- 
nant : H 2 0 (6,8 nl), MgCl 2 25 mM (0,8 ul, 4 uM final de Mg2+), melange reactionnel 
5X (4 ul), sonde SRAS/N/FL 3uM (0,5 ul, 0,075 uM final), sonde SRAS/N/LC705 3 

20 uM (0,5 ul, 0,075 uM final), amorce N/+/28375 10 uM (1 ul, 0,5 uM final), amorce 
N/-/28702 10 uM (1 ^1, 0,5 \iM final), melange d'enzyme (0,4 ^1) et echantillon 
(ARN viral, 5 |xl) a ete amplifie en suivant le programme suivant : 

- Transcription inverse : 50°C 10:00min analysis mode: none 

- Denaturation : 95°C 30sec xl analysis mode: none 
25 - Amplification : 95°C 2sec > 

50°C 15sec analysis mode: quantification *) x45 

72°C 13sec rampe thermique 2,0°C/sec } 

- refroidissement : 40°C 30sec xl analysis mode: none 

*La mesure de fluorescence se fait a la fin de l'hybridation et a chaque cycle (en mode 
30 SINGLE). 
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Les resultats presentes a la figure 12 montrent que cette RT-PCR en 
temps reel est tres sensible puisqu'elle permet de d&ecter 10 2 copies d'ARN 
synthetique dans 100% des 5 echantillons analyses (29/29 echantillons dans 8 expe- 
riences) et jusqu'a 10 copies d'ARN dans 100% des 5 echantillons analyses (40/45 

5 echantillons dans 8 experiences). Elle montre egalement que cette RT-PCR permet de 
detecter la presence du genome du SARS-CoV dans un echantillon et de quantifier le 
nombre de genomes pr6sents. A titre d'exemple, l'ARN viral d'un stock de SARS- 
CoV cultive sur cellules Vero E6 a 6t6 extrait a l'aide du kit "Qiamp viral RNA 
extraction" (Qiagen), dilue a 0,05. 10" 4 et analys6 par RT-PCR en temps reel selon le 

10 protocole decrit ci-dessus; l'analyse presentee a la figure 12 montre que ce stock de 
virus contient 6,5.1 0 9 genomes -equivalents/ml (geq/ml), ce qui est tout a fait 
similaire a la valeur de 1,0.10 10 geq/ml mesuree a l'aide du kit "RealArt™ HPA- 
Coronavirus LC RT PCR Reagents" commercialise par Artus. 

2) Mise au point de conditions de RT-PCR nichee ciblant le gene de l'ARN 
15 polymerase - test "RT-PCR nichee CDC (Centers for Disease Control and 
Prevention) /IP" 

a) Extraction de l'ARN viral 

20 Echantillon cliniaue : QIAamp viral RNA Mini Kit (QIAGEN) selon les indications 
du fabricant, ou une technique equivalente. L'ARN est €hi6 dans un volume de 60 ul. 

b) RT-PCR nichee "SNE/SAR" 

Premiere etape : RT-PCR couplie « SNE » 

25 

Le kit Invitrogen "Superscript™ One-Step RT-PCR with Platinum® 

Taq"a. 6t6 utilise^ mais le kit "Titan" de Roche Boehringer peut lui Stre substitu6 avec 

des r6sultats similaires. 

Oligonucleotides : 
30 -SNE-S1 5' GGT TGG GAT TAT CCA AAA TGT GA 3' 

- SNE-AS1 5'GCA TCA TCA GAA AGA ATC ATC ATG 3' 

-> Taille attendue :440 pb 

1. Preparer un mix : 

H20 6,5 ul 
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Reaction mix 2X 12,5 ul 

Oligo SNE-S1 50 \iM 0,2 ul 

Oligo SNE-AS1 50 uM 0,2 ul 
RNAsin40U/ul 0,12 ul 

5 RT/Platinum Taq mix 0, 5 ul 

2. A 20 ul du mix, ajouter 5 ul d'ARN et proceder a l'amplification sur 
thermocycleur (conditions ABI 9600) : 
2.1 45°C 30min. 
55°C 15 min. 



10 94°C 2 min. 

2.2. 94°C 15 sec. } 

45°C 30 sec. } x 5 cycles 

72°C 30 sec. } 

2.3. 94°C 15 sec. } 

15 55°C 30 sec. }x 35 cycles 



72°C 30 sec. + 2sec./cycle } 
2.4. 72°C 5 min. 
2.5 10°C oo 
Conservation a +4°C. 

20 La RNAsin (N2511/N2515) de Promega a ete utilisee comme 

inhibiteurs de RNase. 

Des ARN synthetiques ont servi de temoin positif. A titre de 
controle, 10 3 , 10 2 et 10 copies d'ARN synthetique Rsne ont ete amplifies dans chaque 
experience. 
25 Seconde itape : PCR nichie "SAR" 
Oligonucleotides : 

- SAR1-S 5' CCT CTC TTG TTC TTG CTC GCA 3' 

- SAR1-AS 5' TAT AGT GAG CCG CCA CAC ATG 3' 
-> Taille attendue : 121 pb 

30 1 . Preparer un mix : 

H20 35,8 nl 

Tampon Taq 10X 5 ul 
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MgCl 2 25 mM 4 ul 

Mix dNTPs 5 mM 2 ul 

Oligo SAR1-S 50 uM 0,5 ul 

Oligo SAR1-AS 50 uM 0,5 ul 
5 Taq ADN pol 5 U/ul 0,25 ul 

L'AmpliTag DNA Pol d'Applied Biosystems a ete utilisee (tampon 
10X sans MgCl 2 , ref 27216601). 

2. A 48 nl du mix, ajouter 2 ul du produit de la premiere PCR et proceder a 
ramplification (conditions ABI 9600) : 



10 2.1. 94°C 2min. 

2.2. 94°C 30 sec. } 

45°C 45 sec. }x5 cycles 

72°C 30 sec. } 

2.3. 94°C 30 sec. } 

15 55°C 30 sec. }x 35 cycles 



72°C 30 sec. + lsec/cycle } 
2.4. 72°C 5min. 
2.5 10°C oo 

3. Analyser 10 ul du produit reactionnel sur gel "low-melting" (type Seakem GTG) a 
20 3% d'agarose. 

La sensibility du test nich6 est en routine, dans les conditions 
decrites, de 10 copies d'ARN. 

4. Les fragments peuvent ensuite Stre purifies sur QIAquick PCR kit (QIAGEN) et 
sequences avec les oligos SAR1-S et SARI -AS. 

25 3) Detection de TARN du SARS-CoV par PCR a partir de prelevements 
respiratoires 

a) Premiere etude comparative 

Une 6tude comparative a 6t6 realisee sur une s6rie de prelevements 
respiratoires recus par le Centre National de Reference du Virus Influenzae (region 
30 nord) et susceptibles de contenir du SARS-CoV. Pour ce faire, TARN a ete extrait des 
prelevements a l'aide du kit "Qiamp viral RNA extraction" (Qiagen) et analyse par 
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RT-PCR en temps reel, d'une part a Taide des couples d'amorces et de sondes de la 
s6rie n° 2 dans les conditions ddcrites ci-dessus d f une part, et d'autre part k l'aide du 
kit "LightCycler SARS-CoV quantification kit" commercialism par Roche (reference 
03 604 438). Les resultats sont resumes dans le Tableau VI ci-dessous. lis montrent 

5 que 18 des 26 prelevements sont nSgatifs et 5 des 26 pr&evements sont positifs pour 
les deux kits, tandis qu'un preldvement est positif pour le seul kit Roche et deux pour 
les seuls reactifs N M serie2". En outre, pour 3 prelevements (20032701, 20032712, 
20032714) les quantity d'ARN detects sont nettement sup^rieures avec les reactifs 
(sondes et amorces) de la serie n°2. Ces resultats indiquent que les amorces et sondes 

10 N "serie2" sont plus sensibles pour la detection du genome du SARS-CoV dans des 
prelevements biologiques que celles du kit actuellement disponible. 

Tableau VI; Analyse par RT-PCR en temps r6el des ARN extraits (Tune serie de 
prelevements de 5 patients a l'aide des couples d'amorces et de sondes de la serie 
n° 2 (N "serie 2 M ) ou du kit "LightCycler SARS-CoV quantification kit" (Roche). 
15 Le type de prelfevement est indique ainsi que le nombre de copies de genome viral 
mesurees dans chacun des deux tests. NEG : RT-PCR negative. 



Prelevements n° 


Patient 


Type de prelevement 


KIT ROCHE 


N "s<§rie2" 


20033082 


K 


nasal 


NEG 


NEG 


20033083 


K 


pharyngS 


NEG 


NEG 


20033086 


K 


nasai 


NEG 


NEG 


20033087 


K 


pharynge 


NEG 


NEG 


20032802 


M 


nasal 


NEG 


NEG 


20032803 


M 


expectoration 


NEG 


NEG 


20032806 


M 


nasal ou pharyng6 


NEG 


NEG 


20031 746ARN2 


C 


pharynge 


NEG 


NEG 


20032711 


C 


nasal ou pharynge 


39 


NEG 


20032910 


6 


nasal 


NEG 


NEG 


20032911 


B 


pharynge 


NEG 


NEG 


20033356 


V 


expectoration 


NEG 


NEG 


20033357 


V 


expectoration 


NEG 


NEG 


20031725 


K 


asp. endotracheal 


NEG 


150 


j 20032657 


K 


asp. endotracheal 


NEG 


NEG 


20032698 


K 


asp. endotracheal 


NEG 


NEG 


20032720 


K 


asp. endotracheale 


3 


5 


20033074 


K 


selles 


115 


257 


20032701 


M 


pharynge 


443 


1676 


20032702 


M 


expectoration 


NEG 


249 


20031 747 ARN2 


C 


pharynge 


NEG 


NEG 


20032712 


C 


inconnu 


634 


6914 


20032714 


C 


pharyng^ 


17 


223 


20032800 


B 


nasal 


NEG 


NEG 


20033353 


V 


nasal 


NEG 


NEG 


20033384 


V 


nasal 


NEG 


NEG 
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tO Deuxi&me etude comparative 

Les performances de diffSrentes m6thodes de RT-PCR nichee et de 
RT-PCR en temps reel ont ensuite 6t6 comparees pour 121 pr61evements respiratoires 
de cas possibles de SRAS de l'hopital fran9ais de Hanoi, Vietnam, realises entre le 
5 4* me et le 17 6me jour apres le d<§but des symptomes. Parmi ces preldvements, 14 avaient 
ete trouves positifs lors d'un premier test utilisant la m^thode de RT-PCR nichee 
ciblant l'ORFlb (codant pour la nSplicase) telle que decrite initialement par le 
Bernhard Nocht Institute (RT-PCR nichee BNI). Des informations concernant ce test 
sont disponibles sur internet, a l'adresse http://Avwwl5.bni- 
10 hambui < g.de /bni/bni2/neu2/getfile.acgi?ai'ea engl=diagnostics&pid=41 12 . 

Les diffSrents tests compares dans cette £tude sont : 

la methode de RT-PCR quantitative selon l'invention, avec les 
amorces et sonde N "serie 2" decrite ci-dessus (colonne Light 
Cycler N), 

15 - le test de RT-PCR nichee ciblant le gene de l'ARN polymerase 

dScrit ci-dessus, d^veloppe par le CDC, le BNI et l'lnstitut 
Pasteur (RT-PCR nichee CDC/IP), 

- le kit ARTUS de r^rence "HP A Corona LC RT-PCR Kit 
# 5601-02", qui est un test de RT-PCR en temps reel ciblant le 

20 g&ie ORFlb, 

- le test de RT-PCR nichee du BNI, ciblant egalement le gene de 
TARN polymerase, mentionn£ ci-dessus. 

Les inventeurs ont constate : 

1) une variability inter-test pour une meme technique, liee a la 
25 degradation de la preparation d' ARN lors de decongelations r^petees, notamment pour 

les Schantillons contenant les quantites d'ARN les plus faibles, 

2) une sensibility r6duite de la RT-PCR nichee CDC/IP par rapport 
k la RT-PCR nichee BNI, et 

3) une sensibilite comparable du test de RT-PCR quantitative selon 
30 l'invention (Light Cycler N) par rapport au test Light Cycler (LC) Artus. 

Ces resultats, pr6sent6s dans le Tableau VII ci-dessous, montrent que 
le test par RT-PCR quantitative selon l'invention constitue un excellent complement - 
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ou une alternative - aux tests actuellement disponibles. En effet, le coronavirus lie au 
SRAS est un virus emergent, susceptible d'evoluer rapidement. En particulier, le gene 
de la RNA polymerase du coronavirus li6 au SRAS, qui est cibl6 dans la plupart des 
tests actuellement disponibles, peut recombiner avec celui d'autres coronavirus non 
5 ltes au SRAS. ^utilisation d'un test ciblant exclusivement ce gfcne pourrait alors 
conduire h l'obtention de faux n^gatifs. 

Le test par RT-PCR quantitative selon Tinvention ne cible pas la 
meme region g&iomique que le kit ARTUS, puisqu'il cible le gene codant pour la 
proteine N. En r6alisant un test de diagnostique ciblant deux genes differents du 
10 coronavirus lie au SRAS, on peut done espfrer s'afifranchir de resultats de type faux 
negatifs, qui pourraient etre dus k 1'evolution g&ietique du virus. 

De plus, il apparait particulterement avantageux de cibler le gdne de la 
proteine de nucteocapside, car il est tres stable, du fait de la forte pression de selection 
lide aux contraintes structurales 6lev6es concernant cette protdine. 

15 
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Tableau VII; Comparaison de differentes methodes d'analyse par amplification 
genique, a partir de 121 Prelevements de cas probables de SRAS de I'hopital 
francais de Hanoi, Vietnam (epidemie 2003) 



IM UNK 


Type 
prelevement 


Jour 
prelevement 


Patient 


RT- 
PCR 
nichee 
CDC/IP 


RT- 
PCR 
nichee 
BNI 


kit Light 
Cycler 
Artus 


Light 
Cycler 
N (IP) 


preievements 


N et P 






NSgatif 


Negatif 


N6gatif 


Negatif 


032529 


P 


10 


MHR 

INIID 




Pncifif 


in din 


Kl&natif 
iNcgdllT 


032530 


N 


10 


NHB 


Positif 


Positif 


3.10E+01 


4.20E+01 


| 032531 


P 


7 


LP 


Positif 


Positif 


7.70E+00 


3.10E+00 


032534 


N 


15 


BND 


Positif 


Positif 


1.60E+00 


Negatif 


032600 


P 


4 


NHH 


N6gatif 


Positif 


Negatif 


1.30E+02 


032612 


P 


17 


NTS 


NSgatif 


Positif 


Negatif 


Negatif 


032688 


P 


9 


BTX 


Positif 


Positif 


Negatif 


Negatif 


032689 


N 


4 


NVH 


Positif 


Positif 


1.20E+01 


2.30E+02 


032690 


P 


4 


NVH 


Negatif 


Positif 


1.60E+00 


Negatif 


032727 


P 


8 


NVH 


Positif 


Positif 


2.30E+02 


4.00E+02 


032728 


N 


8 


NVH 


Positif 


Positif 


1.10E+03 


1.60E+04 


032729 


P 


14 


NHB 


Positif 


Positif 


5.90E+00 


3.40E+01 


032730 


N 


14 


NHB 


Positif 


Positif 


1.30E+02 


4.80E+02 


032741 


P 


8 


NHH 


Positif 


Positif 


2.10E+02 


1.30E+02 




positifs 


10 


14 


10 


9 


fraction detectee des 14 positifs 


71,4% 


100,0% 


71,4% 


64,3% 



5 (1) P= 6couvillonage pharynge 



N= 6couvillonage nasal 

Exemple 9 : Obtention et caracterisation d v anticorps monoclonaux diriges contre 
la proteine N 

10 Des souris Balb C ont 6t6 immunises k Taide de la proline N 

recombinante purifiee et leurs cellules spl&iiques fusionnees avec un myelome murin 
approprie selon les techniques de KQhler et Milstein. 

Dix-neuf hybridomes secreteurs d'anticorps anti N ont 6t6 
preselectionnes et leurs immuno r6activit6s prScisees. Ces anticorps reconnaissent 

15 bien la proline N recombinante (en ELISA) avec des intensity variables, ainsi que la 
proteine virale, naturelle N en ELISA et/ou en Western Blot. Les figures 18 k 20 
montrent les resultats de ces tests pour 15 de ces 19 anticorps monoclonaux. 

Les clones 12, 17, 28, 57, 72, 76, 86, 87, 98, 103, 146, 156, 166, 
170, 199, 212, 218, 219 et 222, fortement r6actifs, ont <§te sous clones. Les etudes de 

20 specified ont 6te poursuivies avec les outils approprtes afin de pr^ciser les Epitopes 
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reconnus et verifier Fabsence de reactivity vis-^-vis des autres Coronavirus humains et 
de certains virus respiratoires. 

Les 6tudes de cartographie {mapping) epitopique (r£alisees sur 
membrane spot, a Taide de peptides chevauchants de 15 aa) et les Etudes 
5 supptementaires realisees sur la prot&ne N naturelle en Western Blot ont x6v6l6 
l'existence de 4 groupes d'anticorps monoclonaux : 

1° Anticorps monoclonaux specifiques d f un epitope lineaire majeur 
en position N-ter (75-81, sequence : INTNSVP) 

Le representant de ce groupe est Tanticorps 156, L'hybridome 
10 produisant cet anticorps a ete d6pose a la Collection Nationale de Cultures de 
Microorganismes (CNCM) de l'lnstitut Patseur (Paris, France) le l er decembre 2004, 
sous le numero 1-3331. Ce meme epitope est Sgalement reconnu par un serum de 
lapin (polyclonal anti N) obtenu par immunisation classique a l'aide de cette meme 
proteine N. 

15 2° Anticorps monoclonaux specifiques d'un Epitope lineaire majeur 

situ6 en position centrale (position 217-224, sequence : ETALALL); les representants 
de ce groupe sont les anticorps monoclonaux 87 et 166. L'hybridome produisant 
1'anticorps 87 a ete depose a la CNCM le l er decembre 2004, sous le numero 1-3328. 

3° Anticorps monoclonaux specifiques d ! un Epitope lineaire majeur 

20 situe en position C-terminale (position 403-408, sequence : DFFRQL), les 
representants de ce groupe sont les anticorps 28, 57 et 143. L'hybridome produisant 
1'anticorps 57 a 6te depose a la CNCM le l er decembre 2004, sous le numero 1-3330. 

4° Anticorps monoclonaux specifiques d ! un epitope discontinu, 
conformationel. Ce groupe d'anticorps ne reconnait aucun des peptides recouvrant la 

25 sequence de la proteine N, mais r^agissent fortement sur la proteine naturelle non 
d&iaturee. Le representant de ce dernier groupe est Tanticorps 86: L'hybridome 
produisant cet anticorps a ete d£pos£ a la CNCM le l er decembre 2004, sous le num£ro 
1-3329. 

Le Tableau VIII ci-apres resume les r^sultats de cartographie 
30 epitopique obtenus : 



Tableau VIII : Mapping Epitopique des anticorps monoclonaux 



Anticorps 


Epitope 


Position Region 


28 


DFSRQL Q 


403 ...408 C-Ter. 
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143 


DFSRQL Q 






76 


DFSRQL Q 




57 


DFSRQL 0 








315 ..; 319 


146 J 


LPQRQ 


383 ...387 


xoo 


TPTAT ATT H 


217 ... 224 


centrale 


87 


ETALALL 


217 224 


156 


INTNSGP 


75... W 




86 


Conformationnel 






212 


Conformationnel 






170 


Conformationnel 







En outre, comme illustre notamment aux figures 18 et 19, ces 
anticorps ne prSsentent pas de reactivite en ELISA et/ou en WB, vis k vis de la 
proline N du coronavirus humain 229 E. 
5 Exemple 10 : Combinaisons des anticorps monoclonaux pour le developpement 
d'un test d'immunocapture sensible et sp6cifique de l'antig&ne viral N dans le 
serum ou les fluides biologiques des patients contamines par le virus SARS Co V 
Les anticorps listes ci-dessous ont ete retenus en raison de leurs 
proprietes bien particulteres pour une 6tude suppl&nentaire de capture et detection de 
10 la proteine virale N, dans le s£rum des sujets ou patients, 

Ces anticorps ont 6te produits en ascite sur souris, purifies par 
chromatographie d'affinit^ et utilises seuls ou en combinaison comme anticorps de 
capture, et comme anticorps signal. 

Liste des anticorps s61ectionn6s pour le propos : 
1 5 - Acm anti region C-ter (n° 28, 57, 1 43) 

- Acm anti region centrale (n° 87, 166) 

- Acm anti region N-ter (n° 156) 

- Acm anti epitope discontinu, conformationnel (86) 
1) Preparation des reactifs : 

20 a) Plaques ELISA immuno capture 
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Les plaques sont sensibilis£es avec les solutions d'anticorps k 5 
fxg/ml en tampon carbonate 0,1 M, pH.9,6. Les solutions (monovalentes ou 
plurivalentes) sont depos^es sous volume de 100 ^1 dans les puits et incub6es pendant 
une nuit k temperature ambiante. Ces plaques sont ensuite lav6es en tampon PBS (10 
5 mM pH 7,4 additionne de 0,1% de Tween 20) puis satur^es avec une solution de PBS 
additionn6e de 0,3% de BSA et de 5% de Saccharose). Les plaques sont ensuite 
sech6es puis conditionnees dans un sachet en presence d f un dessicant. Elles sont pretes 
a l'emploi. 

b) Coniueu^s 

10 Les anticorps purifies ont ct€ couples a la peroxydase selon le 

protocole de Nalcane (Nakane et al. - 1974, J.of Histo and cytochemistry, vol.22, 
pi 084- 1091) dans un rapport de une molecule d'IgG pour 3 molecules de peroxydase. 
Ces conjugues ont 6t6 purifies par chromatographie d'exclusion et conserves 
concentres (concentration comprise entre 1 a 2 mg/ml) en presence de 50% de 

15 glycerol et & -20°C. lis sont dilu^s pour leur mise en ceuvre dans les essais a la 
concentration finale de 1 ou 2 ng/ml en tampon PBS (pH 7,4) addition^ de 1% de 
BSA. 

c) Autres r6actifs 

- S6rums humains n^gatifs pour tous les marqueurs seriques des virus HIV, HBV, 
20 HC V et THLV 

- Pool de scrums humains negatifs additionne de 0,5% de Triton X 100 

- Ag viral inactive : surnageant de culture virale inactive par irradiation et 
inactivation v6rifi£e aprds mise en culture sur cellules sensibles - titre de la 
suspension avant inactivation environ 10 7 particules infectieuses par ml ou encore 

25 environ 5x1 0 9 particules virales physiques par ml d'antigene 

- Les echantillons d'Ag dilues en serum humain n<§gatif : ces echantillons ont 6t6 
pr6par6s par dilution au 1 : 1 00 e puis par dilution en s<§rie de raison 5. 

Ces echantillons non infectieux miment des Echantillons humains supposes 
contenir des concentrations faibles a tres faibles de nucteoprot&ne virale N. De 
30 tels echantillons ne sont pas accessibles pour les travaux de routine 
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- Solution de lavage R2, solution de reflation TMB R8, chromogene R9 et solution 
d'arret RIO, sont les r£actifs g£n£riques commercialisms par Bio-Rad dans ses 
trousses ELISA (ex : trousse Platelia Pylori ref.72778). 

2) Mode operatoire 

Les £chantillons de serums humains surcharges en Ag viral inactive 
sont distribues a raison de 100 \i\ par cupule, directement dans les plaques 
sensibilis£es, pretes a l'emploi puis incubes pendant 1 heure a 37°C (incubation Bio- 
Rad IPS). 

Le materiel non retenu par la phase solide est ^limine par 3 lavages 
(lavage avec solution R2 dilute, laveur automatique LP 35). 

Les conjugues approprtes, dilu£s a la concentration finale de 1 ou 2 
\xglm\ sont distribues k raison de 100 f*l par cupule et les plaques incub^es k nouveau 
pendant une heure a 37° C (incubation IPS). 

L'excSs de conjugue est ^limine par 4 lavages successifs (solution 
R2 diluee - laveur LP 35). 

La presence de conjugue fixe sur les plaques est r£velee apres 
addition de 100 jlxI de solution de revelation pr£paree avant emploi (1 ml de R9 et 10 
ml de R8) et apres incubation pendant 30 minutes, k temperature ambiante et k Tabri 
de la lumiere. 

La reaction enzymatique est finalement bloqu£e par addition de 100 
\xl de r£actif R10 (H2S04 IN) dans toutes les cupules. 

La lecture est effectu£e k l'aide d'im lecteur de microplaque 
approprie k double longueur d'onde (450/620 nm), 

Les r£sultats peuvent §tre interpr£tes en utilisant comme valeur seuil 
provisoire la moyenne d'au moins deux controles negatifs multiple par un facteur 2 ou 
encore la moyenne de 100 serums negatifs additionn^e d'un increment correspondant a 
6 SD {Standart Deviation calculee sur les 100 mesures individuelles). 

3) Resultats 

Differentes combinaisons anticorps de capture et anticorps signal ont 
6t6 testees en se fondant sur les propriety des anticorps selectionn£s, et en £vitant les 
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combinaisons cTanticorps sp6cifiques des memes Epitopes en phase solide et en 
conjugu^s. 

Les meilleurs resultats ont et6 obtenus avec les 4 combinaisons 
listees ci-dessous. Ces resultats sont reproduits dans le tableau IX ci-apr6s. 
5 1. Combinaison F/28 

Phase solide (Acm 166 + 87 region centrale) : conjugu6 anticorps 28 (C-ter) 

2. Combinaison G/28 

Phase solide (Acm 86 - epitope conformationel) : conjugu<§ anticorps 28 (C-ter) 

3 . Combinaison H/28 

10 Phase solide (Acms 86, 166 et 87 region centrale et Epitope conformationel) : 
conjugue anticorps 28 (C-ter) 

4. Combinaison H/28 + 87 

Phase solide (Acms 86, 166 et 87 region centrale et Epitope conformation^) : 
conjugu<§ mixte anticorps 28 (C-ter) et 87 (central) 
15 5 . Combinaison G/87 

Phase solide (Acm 86 - epitope conformationel) : conjuguS anticorps 87 (region 
centrale) 

Les 4 premieres combinaisons presentent des performances 

equivalentes et reproduces, sup6rieures aux autres combinaisons mises en oeuvre 
20 (comme par exemple la combinaison G/87). Bien entendu, dans ces combinaisons, un 

anticorps monoclonal peut etre remplace par un autre" anticorps reconnaissant le m§me 

epitope. Ainsi, on peut citer les variantes suivantes : 
6. Variante de la combinaison F/28 

Phase solide (Acm 87 uniquement) : conjuguS anticorps 57 (C-ter) 
25 7. Variante de la combinaison G/28 

Phase solide (Acm 86 - epitope conformationel) : conjugu<§ anticorps 57 (C-ter) 
8. Variante de la combinaison H/28 

Phase solide (Acms 86 et 87 region centrale et Epitope conformationel) : conjuguS 

anticorps 57 (C-ter) 
30 9. Variante de la combinaison H/28 + 87 

Phase solide (Acms 86 et 87 region centrale et Epitope conformationel) : conjuguS 

mixte anticorps 57 (C-ter) et 87 (central) 
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Tableau IX : Controle d'immunor£activite des Acm anti 
nucleoproteines SARS CoV : densites optiques mesurSes avec chaque combinaison 
d'anticorps, en fonction des dilutions de l'antigdne viral inactive. 



N° 


Dilution 


F/28 


G/28 


G/87 


H/28 


H/28+87 


0 


1/100 


5 


5 


3,495 


3,900 


5 


1 


1/500 


3,795 


3,814 


1,379 


3,702 


3,804 


2 


Vz 500 


2,815 


2,950 


0,275 


3,268 


2,680 


3 


1/12 500 


0,987 


1,038 


0,135 


1,374 


0,865 


4 


1/62 500 


0,404 


0,348 


0,125 


0,480 


0,328 


5 


1/312 500 


0,285 


0,211 


0,123 


0,240 


0,215 


6 


T6moin 


0,210 


0,200 


0,098 


0,186 


0,156 


7 


Temoin 


0,269 


0,153 


0,104 


0,193 


0,202 



5 

La limite de detection de ces 4 essais experimentaux correspond k la 
dilution d'antigdne en s<§rum n^gatif 1:62500. Une extrapolation rapide laisse supposer 
la detection de moins de 10 3 particules infectieuses par ml de scrums. 

De cette etude, il ressort que les anticorps les mieux appropries pour 
10 la capture de la nucleoproteine virale native sont les anticorps sp^cifiques de la region 
centrale et/ou d'un epitope conformationnel, Tun et l'autre etant des anticorps 
selectionnes egalement pour leur forte affinite pour l'antigene natif. 

Ayant determine les meilleurs anticorps pour la composition de la 
phase solide, les anticorps a retenir en priority pour la detection des antigenes fixes sur 
15 la phase solide, sont les anticorps comptementaires spScifiques d ! un Epitope dominant 
en region C-ter. L'emploi de tout autre anticorps complementaire, mais sp£cifique des 
Epitopes localises en region N-ter de la proline conduit k des resultats moyens ou 
mediocres. 

Exemple 11 ; Systemes d'expression eucaryotes de la proteine de spicule (S) du 
20 coronavirus associe au SRAS (SRAS-CoV) 

1) Optimisation des conditions d'expression de la S du SRAS-CoV en cellules de 
mammifferes. 

Les conditions d'expression transitoire de la proline de spicule (S) 
du SRAS-CoV ont ete optimises en cellules de mammiferes (293T, VeroE6). 
25 Pour cela, un fragment d'ADN contenant le cDNA de la S du SRAS- 

CoV a 6X6 amplifie par PCR a l'aide des oligonucleotides 5 '-ATAGGATCCA 
CCATGTTTAT TTTCTTATTA TTTCTTACTC TCACT-3' et 5 '-ATACTCGAGTT 
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ATGTGTAATG TAATTTGACA CCCTTG-3' k partir du plasmide pSARS-S 
(C.N.C.M. n° 1-3059) puis insere entre les sites BamHl et Xhol du plasmide 
pTRIPAU3-CMV contenant un vecteur lentiviral TRIP (Sirven, 2001, MoL Ther., 3, 
438-448) pour obtenir le plasmide pTRIP-S. Le fragment BamHl et Xhol contenant 
5 le cDNA de la S a ensuite ete sous-clone entre les BamHl et Xhol du plasmide 
d' expression eucaryote pcDNA3.1(+) (Clontech) pour obtenir le plasmide pcDNA-S. 
Le fragment Nhel et Xhol contenant le cADN de la S a ensuite 6t6 sous-clone entre 
les sites correspondants du plasmide d'expression pCI (Promega) pour obtenir le 
plasmide pCI-S. Les sequences WPRE du virus de Thepatite de la marmotte 
10 ('Woodchuck Hepatitis Virus posttranscriptional regulatory element") et les 
sequences CTE ^constitutive transport element") du retrovirus simien de Mason- 
Pfizer ont ete ins^rees dans chacun des deux plasmides pcDNA-S et pCI-S entre les 
sites Xhol et Xbal pour obtenir respectivement les plasmides pcDNA-S-CTE, 
pcDNA-S-WPRE, pCI-S-CTE et pCI-S-WPRE (figure 21). Le plasmide pCI-S-WPRE 
15 a ete depose a la CNCM, le 22 novembre 2004, sous le num^ro 1-3323, Tous les 
inserts ont ete sequences a Paide d'un kit BigDye Terminator vl.l (Applied 
Biosystems) et d'un sequenceur automatique ABI377. 

La capacite des plasmides construits a diriger Texpression de la S du 
SRAS-CoV dans des cellules de mammifSres a ete recherchee apres transfection de 
20 cellules VeroE6 (figure 22). Dans cette experience, des monocouches de 5xl0 5 
cellules VeroE6 en boites de Petri de 35mm ont ete transferees avec 2 \xg des 
plasmides pcDNA (a titre de controle), pcDNA-S, pCI et pCI-S et 6 yl de reactif 
Fugene6 selon les indications du fabricant (Roche). Apres 48 heures d'incubation a 
37°C et sous 5% de CCb, des extraits cellulaires ont 6te pr6par6 en tampon de dep6t 
25 selon Laemmli, separes sur un gel SDS h 8% de polyacrylamide, puis transferes sur 
une membrane de PVDF (BioRad). La detection de cette immunoempreinte (« western 
blot ») a ete realisee a Taide d'un serum polyclonal de lapin anti-S (immun-serum du 
lapin PI 1 135 : cf exemple 4 ci-dessus) et d'anticorps polyclonaux d'ane diriges contre 
les IgG de lapin et couples a la peroxidase (NA934V, Amersham). Les anticorps fixes 
30 ont ete reveies par luminescence h l'aide du kit ECL+ (Amersham) et de films 
d 5 autoradiographic Hyperfilm MP (Amersham). 
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Cette experience (figure 22) montre que le plasmide pcDNA-S ne 
permet pas de dinger Texpression de la S du SRAS-CoV a des niveaux detectables 
tandis que le plasmide pCI-S permet une expression faible, proche de la limite de 
detection, qui peut Stre mise en evidence lorsque le film est surexpose. Des r^sultats 
5 similaires ont ete obtenus lorsque Texpression de la S a ete recherchee par 
immunofluorescence (donnees non montrees). Cette impossibilite de detecter une 
expression efficace de la S ne peut pas etre imputee aux techniques de detection 
utilisees puisque la proline S peut etre mise en evidence a la taille attendue (180 kDa) 
dans un extrait de cellules infectSes par le SRAS-CoV ou dans un extrait de cellules 

10 VeroE6 infectees par le virus recombinant de la vaccine W-TF7.3 et transferees par 
le plasmide pcDNA-S. Dans cette derniere experience, le virus VV-TF7.3 exprime 
TARN polymerase du phage T7 et permet la transcription cytoplasmique d'un ARN 
non coiffe susceptible d'etre traduit efficacement Cette experience suggere que les 
defauts d'expression decrits ci-dessus sont dus k une incapacity intrins6que du cADN 

15 de la S a etre exprime efficacement lorsque Petape de transcription en ARN messager 
est r^alisee au niveau nucleaire. 

Dans une seconde experience, Peffet des signaux CTE et WPRE sur 
Texpression de la S a 6te recherchee apres transfection de cellules VeroE6 (figure 
23A) et 293T (figure 23B) et selon un protocole similaire a celui d6crit ci-dessus. 

20 Alors que Texpression de la S ne peut pas etre mis en evidence aprds transfection des 
plasmides pcDNA-S-CTE et pcDNA-S-WPRE derives de pcDNA-S, l'insertion des 
signaux WPRE et CTE ameiiore fortement l'expression de la S dans le contexte du 
plasmide d'expression pCI-S. 

Pour preciser ce resultat, une deuxieme serie d' experiences a ete 

25 realisee, oH Timmunoempreinte est reveiee de fa9on quantitative par luminescence et 
acquisition sur un dispositif d'imagerie numerique (FluorS, BioRad). L' analyse des 
resultats obtenus avec le logiciel QuantityOne v4.2.3 (BioRad) montre que les 
sequences WPRE et CTE augmentent respectivement l'expression de la S d ! un facteur 
20 k 42 et 10 a 26 en cellules Vero E6 (Tableau X). En cellules 293T (Tableau X), 

30 Teffet de la sequence CTE est plus modere (4 a 5 fois) tandis que celui de la sequence 
WPRE reste important (13 h 28 fois). 
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10 



Tableau X analyse quantitative de 1'effet des signaux CTE et WPRE sur 
P expression de la S du SRAS-CoV : Des extraits cellulaires ont et6 prepares 48 
hemes apres transfection de cellulesVeroE6 ou 293T par les plasmides pCI, pCI-S, 
pCI-S-CTE et pCI-S-WPRE et analyses par western blot comme decrit dans la 
legende de la figure 22. Le western blot est t6v6\6 par luminescence (ECL+, 
Amersham) et acquisition sur un dispositif d'imagerie numerique (FluorS, BioRad). 
Les niveaux d'expression sont indiques en fonction d'une 6chelle arbitraire ou la 
valeur de 1 repr^sente le niveau mesure apr£s transfection du plasmide pCI-S. 
Deux experiences ind^pendantes ont ete realisees pour chacun des deux types 
cellulaires. Dans P experience 1 sur cellules VeroE6, les transfections ont ete realises 
en dupliques et les resultats sont indiques sous la forme de moyennes et ecart-types 



Plasmide 


Cellule 


exp. 1 


exp. 2 


PCI 


VeroE6 


0,0 


0,0 


pCI-S 


VeroE6 


1,0±0,1 


1,0 


pCI-S-CTE 


VeroE6 


9,8 ±0,9 


26,4 


pCI-S-WPRE 


VeroE6 


20,1±2,0 


42,3 


PCI 


293T 


0,0 


0,0 


PCI-S 


293T 


1,0 


1.0 


PCI-S-CTE 


293T 


4,6 


4,0 


PCI-S-WPRE 


293T 


27,6 


12,8 



En resume, P ensemble de ces resultats montre que P expression dans 
15 des cellules de mammifdres du cADN de la S du SRAS-CoV sous la dependance de 
sequences promotrices de PARN polymerase II, requiert, pour etre efficace, la 
presence d'un signal d'6pissage ainsi que de Pune ou P autre des sequences WPRE et 
CTE. 
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2) Obtention de lignees stables permettant l'expression de la S du SRAS-CoV 

Le cADN de la proteine S du SRAS-CoV a 6t6 c\on6 sous la forme 
d'un fragment BamHl-Xhol dans le plasmide pTRIPAU3-CMV contenant un vecteur 
5 lentiviral d^fectif TRIP k DNA flap central (Sirven et al, 2001, Mol. Ther., 3 :438- 
448) pour obtenir le plasmide pTRIP-S (figure 24). La co-transfection transitoire selon 
Zennou et al (2000, Cell, 101 : 173-185) de ce plasmide, d'un plasmide 
d'encapsidation (p8.2) et d'un plasmide d'expression de la glycoproteine d'enveloppe 
G du VSV (pHCMV-G) dans des cellules 293T a permis la preparation de 

10 pseudoparticules r&rovirales contenant le vecteur TRIP -S et pseudotypees par la 
proteine d'enveloppe G. Ces vecteurs TRIP-S pseudotypes ont 6t6 utilises pour 
transduire des cellules 293T et FRhK-4 : aucune expression de la proteine S n'a pu 
etre mis en Evidence par western blot et immunofluorescence dans les cellules 
transduites (donnSes non presentees). 

15 Les cassettes d'expression optimales constitutes du promoteur 

immediat/precoce du virus CMV, d'un signal d'epissage, du cDNA de la S et de Tun 
ou l'autre des signaux post-transcriptionnels WPRE ou CTE decrites ci-dessus ont 
alors ete substitutes a la cassette EFla-EGFP du vecteur d'expression lentiviral 
defectif a DNA FLAP central TRIPAU3-EFla (Sirven et al, 2001, Mol. Ther., 3 :438- 

20 448) (figure 25). Ces substitutions ont ete r£aiis£es par une serie de sous-clonages 
successifs des cassettes d'expression de S qui ont 6t& excises des plasmides pCT-S- 
CTE (Bglll-Apal) ou respectivement pCI-S-WPRE (Bglll-Sall) puis insSrees entre 
les sites Mlul et Kpnl ou respectivement Mlul et Xhol du plasmide TRIPAU3-EFla 
pour obtenir les plasmides pTRIP-SD/SA-S-CTE et pTRIP-SD/SA-S-WPRE, dtposts 

25 a la CNCM, le l er d6cembre 2004, sous les numeros 1-3336 et 1-3334, respectivement. 
Des vecteurs pseudotypes ont 6te produits selon Zennou et al (2000, Cell, 101 : 173- 
185) et utilises pour transduire des cellules 293T (10000 cellules) et FRhK-4 (15000 
cellules) selon une serie de 5 cycles successifs de transduction avec une quantite de 
vecteur correspondant a 25 ng (TRIP-SD/SA-S-CTE) ou 22 ng TRIP-SD/SA-S- 

30 WPRE) de p24 par cycle. 

Les cellules transduites ont 6te clondes par dilution limite et une 
serie de clones ont 6te analysts pour l'expression de la S du SRAS-CoV 
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qualitativement par immunofluorescence (donnees non montrees), puis 
quantitativement par western blot (figure 25) a l'aide d'un serum polyclonal de lapin 
anti-S. Les resultats presents dans la figure 25 montrent que les clones 2 et 15 de 
cellules FrhK4-s-CTE transduites par TRIP-SD/SA-S-CTE et les clones 4, 9 et 12 de 
5 cellules FRhK4-S-WPRE transduites par TRIP-SD/SA-S-WPRE permettent 
l'expression de la S du SRAS-CoV a des niveaux respectivement faibles et moderes si 
on les compare k ceux que Ton peut observer au cours de l'infection par le SRAS- 
CoV. 

En resume, les vecteurs TRIP-SD/SA-S-CTE et TRIP-SD/SA-S- 

10 WPRE permettent l'obtention de clones stables de cellules FRhK-4 et de fa9on 
similaire 293T exprimant la S du SRAS-CoV, alors que les essais realises avec le 
vecteur "de base' 1 TRIP-S sont rest£s infructueux, ce qui demontre la n^cessite d'un 
signal d'6pissage ainsi que de l'une, ou l'autre, des sequences CTE et WPRE pour 
l'obtention de clones cellulaires stables exprimant la proline S. 

15 En outre, ces modifications du vecteur TRIP (insertion d'un signal 

d'epissage et d ! un signal post-transcriptionnel comme CTE et WPRE) pourraient 
s'avfrer interessantes pour ameliorer l'expression d'autres cDNA que celui de la S. 

3) Obtention de lignees stables permettant l'expression d'une forme 
soluble de la S du SRAS-CoV. Purification de cet antigene recombinant 

20 Un cDNA codant pour une forme soluble de la proline S (Ssol) a 

6t6 obtenu en fusionnant les sequences codant pour Tectodomaine de la proteine 
(acides amines 1 k 1 193) k celles d'une Etiquette (FLAG : DYKDDDDK) via un linker 
BspEl codant pour le dipeptide SG. Pratiquement, pour obtenir le plasmide pcDNA- 
Ssol, un fragment d'ADN codant pour Tectodomaine de la S du SRAS-CoV a 6t6 

25 amplify par PCR a Taide des oligonucleotides 5 ' - ATAGGATCC A CCATGTTTAT 
TTTCTTATTA TTTCTTACTC TCACT-3' et 5'-ACCTCCGGAT TTAATATATT 
GCTCATATTT TCCCAA-3' k partir du plasmide pcDNA-S, puis insure entre les 
sites uniques BamHl et BspEl uniques d'un plasmide d'expression eucaryote 
pcDNA3.1(+) (Clontech) modifie contenant entre ses sites BamHl et Xhol la 

30 sequence de l'etiquette FLAG : 



WO 2005/056781 



PCT7FR2004/003105 



100 

// GGATCC . . .nnn. . . TCC GGA GAT TAT AAA GAT GAC GAC GAT AAA TAA 
BamHl SGDYKDDDDK ter 

CTCGAG // 
Xhol 

5 

Les fragments Nhel-Xhol et BamHl -Xhol, contenant le cADN de 
la S, ont ensuite 6te excises du plasmide pcDNA-Ssol, et sous-clones entre les sites 
correspondants du plasmide pTRIP-SD/SA-S-CTE et du plasmide pTRIP-SD/SA-S- 
WPRE, respectivement, pour obtenir les plasmides pTRIP-SD/SA-Ssol-CTE et 

10 pTRIP-SD/SA-Ssol-WPRE, deposes a la CNCM, le l er dScembre 2004, sous les 
numeros 1-3337 et 1-3335, respectivement 

Des vecteurs pseudotypes ont 6t6 produits selon Zennou et coll. 
(2000, Cell, 101 : 173-185) et utilises pour transduire des cellules FRhK-4 (15000 
cellules) selon une s6rie de 5 cycles successifs de transduction (15000 cellules) avec 

15 une quantity de vecteur correspondant a 24 ng (TRIP-SD/SA-Ssol-CTE) ou 40 ng 
TRIP-SD/SA-Ssol-WPRE) de p24 par cycle. Les cellules transduites ont 6t6 donees 
par dilution limite et une serie de 16 clones transduits par TRIP-SD/SA-Ssol-CTE et 
de 15 clones par TRIP-SD/SA-Ssol-WPRE ont 6te analyses pour Pexpression du 
polypeptide Ssol par western blot revele par un anticorps monoclonal anti-FLAG 

20 (figure 26 et donn^es non montr^es), ainsi que par un ELISA-capture sp^cifique du 
polypeptide Ssol qui a 6te mis au point dans ce but (Tableau XI et donn£es non 
montr£es). Une partie du processus de selection des meilleurs clones secreteurs est 
montre dans la figure 26. L'ELISA-capture repose sur Putilisation de phases solides 
recouvertes d'anticorps polyclonaux de lapins immunises par du SRAS-CoV purifie et 

25 inactive. Ces phases solides permettent la capture du polypeptide Ssol secrete dans les 
surnageants cellulaires, dont la presence est ensuite r6v61ee par une serie d'&apes 
impliquant successsivement la fixation d'un anticorps monoclonal anti-FLAG (M2, 
SIGMA), d'anticorps biotinytes polyclonaux de lapin anti-IgG(H+L) de souris 
(Jackson) et d'un conjugu£ streptavidine-peroxidase (Amersham) puis l'addition de 

30 chromogene et de substrat (TMB +' H 2 0 2 , KPL). 
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Tableau XI : analyse de l'expression de polypeptide Ssol par des lign£es 
cellulaires transduites par les vecteurs lentiviraux TRIP-SD/SA-Ssol-WPRE et 
TRIP-SD/SA-SsoI-CTE. La secretion du polypeptide Ssol a 6t6 recherch^e dans le 
surnageant d'une serie de clones cellulaires isotes apres transduction de cellules 
FRhK-4 par les vecteurs lentiviraux TRIP-SD/SA-Ssol-WPRE et TRIP-SD/SA-Ssol- 
CTE. Les surnageants dilu6s au 1/50 ont 6t6 analyses par un test ELISA-capture 



Vectevu: 


Clone 


DO (450 

nm) 


T6moin 




0,031 


TRIP- 

SD/SA-Ssol-CTE 


CTE2 


0,547 


CTE3 


0,668 


CTE9 


0,171 


CTE12 


0,208 


CTE13 


0,133 


TRIP- 
SD/SA-Ssol-WPRE 


WPRE1 


0,061 


WPRE10 


0,134 



La lignee cellulaire s6cretant les quantity les plus elevees de 
polypeptide Ssol dans le surnageant de culture est la lignee FRhK4-Ssol-CTE3. Elle a 
ete soumise a une deuxieme serie de 5 cycles de transduction par le vecteur TRIP- 
SD/SA-Ssol-CTE dans des conditions similaires a celles ddcrites ci-dessus puis 
clonee. Le sous-clone secretant les quantites les plus elev6s de Ssol a 6t6 s^lectionne 
par une combinaison d'analyse par western blot et ELISA-capture : il s'agit du sous- 
clone FRhK4-Ssol-30, qui a 6t6 depose a la CNCM, le 22 novembre 2004, sous le 
numSro 1-3325. 

La lignee FRhK4-Ssol-30 permet la production et la purification en 
quantity du polypeptide recombinant Ssol. Dans une experience type oil les conditions 
exp6rimentales de croissance, de production et de purification ont 6t6 optimises, les 
cellules de la lign6e FRhK4-Ssol-30 sont ensemencees en milieu de culture standard 
(DMEM sans pyruvate contenant 4.5g/l de glucose et supplement^ par 5% de SVF, 
100 U/ml de p&iicilline et 100 jig/ml de streptomycine) sous la forme d'une 
monocouche sous-confluente (1 million de cellules pour chaque 100 cm 2 dans 20 ml 
de milieu). A confluence, le milieu standard est remplacS par le milieu de s6cr£tion oil 
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la quantity de SVF est abaiss^e a 0.5% et la quantity de milieu r^duite k 16 ml pour 
chaque 100 cm 2 . Le surnageant de culture est preleve aprds 4 a 5 jours d'incubation a 
35°C et sous 5% de CO2. Le polypeptide recombinant Ssol est purifi6 k partir du 
surnageant par Penchainement d'6tapes de filtration sur membrane de 
5 polyethersulfone (PES) de 0.1 jim, de concentration par ultrafiltration sur une 
membrane de PES de point de coupure 50kD, de chromatographic d'affinite sur 
matrice anti-FLAG avec 61ution par une solution de peptide FLAG (DYKDDDDK) a 
100 ng/ml en TBS (Tris 50mM pH 7.4, 150 mMNaCl) puis de chromatographie de gel 
filtration en TBS sur billes de sephadex G-75 (Pharmacia). La concentration du 

10 polypeptide recombinant Ssol purifte a ete determine par test micro-BCA (Pierce) 
puis ses caracteristiques biochimiques analysees. 

L'analyse par gel SDS k 8 % d'acrylamide colore au nitrate d'argent 
met en Evidence un polypeptide majoritaire dont la masse moteculaire est d' environ 
180kD et dont le degr6 de purete peut etre evalug a 98% (figure 27A). Par 

15 spectrometrie de masse SELDI-TOF (Cyphergen), deux pics principaux sont mis en 
evidence : ils correspondent a des formes simplement, et doublement charg£es d'un 
polypeptide majoritaire dont la masse moleculaire est ainsi determinee a 182,6 ± 3,7 
kD (figures 27B et C). Apres transfert sur membrane Prosorb et rincage en TFA 0,1%, 
Pextremite N-terminale du polypeptide Ssol a ete sequencee en phase liquide par 

20 degradation d'Edman sur 5 r^sidus (ABI494, Applied Biosystems) et determinee 
comme 6tant SDLDR (figure 27D). Ceci d&nontre que le peptide signal localise a 
Pextremite N-terminale de la proline S du SRAS-CoV, compost des aa 1 a 13 
(MFIFLLFLTLTSG) d'apres une analyse r£alisee avec le logiciel signalP v2.0 
(Nielsen et al., 1997, Protein Engineering, 10 : 1-6), est clive du polypeptide Ssol 

25 mature. Le polypeptide recombinant Ssol est done constitue des acides amines 14 a 
1193 de la proteine S du SRAS-CoV fusionnes en C-terminal a une sequence 
SG DYKDDDDK contenant la sequence de P&iquette FLAG (soulign^e). L'Scart 
entre la masse molaire th^orique du polypeptide Ssol nu (132,0 kD) et la masse 
molaire reelle du polypeptide mature (182,6 kD) suggere que le polypeptide Ssol est 

30 glycosyle. 

Une preparation de polypeptide Ssol purifie et dont la concentration 
proteique a 6t6 d6termin6e par test micro-BCA, permet de realiser une gamme etalon 
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pour mesurer k Paide du test ELISA-capture d£crit plus haut les concentrations de 
Ssol present dans les surnageants de culture et de revisiter les caract&istiques des 
lignees secr6trices. Selon ce test, la lignee FRhK4-Ssol-CT3 secrete 4 a 6 ng/ml de 
polypeptide Ssol tandis que la lignee FRhK4-Ssol-30 secrete 9 a 13 ng/ml de Ssol 
5 apres 4 a 5 jours de culture k confluence. En outre, le schema de purification presents 
plus haut permet en routine de purifier de 1 a 2 mg de polypeptide Ssol par litre de 
surnageant de culture. 

Exemple 12 : Immunisation genique visant la proteine de spicule (S) du 
coronavirus associe au SRAS (SRAS-CoV) 
10 L ! effet d'un signal d ! 6pissage et des signaux post-transcriptionnels 

WPRE et CTE a et6 analyse apres immunisation g6nique de souris BALB/c (figure 
28). 

Pour cela, des souris BALB/c ont ete immunises k des intervalles 
de 4 semaines par injection dans le tibialis anterior d'une solution saline de 50 jig 

15 d'ADN plasmidique de pcDNA-S et pCI-S ainsi que, a titre de controle, par 50 |ig 
d'ADN plasmidique de pcDNA-N (dirigeant l'expression de la N du SRAS-CoV) ou 
de pCI-HA (dirigeant l'expression de la HA du virus grippal A/PR/8/34) et les serums 
immuns collects 3 semaines aprds la 2eme injection. La presence d'anticorps diriges 
contre la S du SRAS-CoV a 6te recherch^e par ELISA indirect en utilisant comme 

20 antigSne un lysat de cellules VeroE6 infectees par le SRAS-CoV et a titre de controle, 
un lysat de cellules VeroE6 non infectees. Les titres (TI) en anticorps anti-SRAS-CoV 
sont calcules comme l'inverse de la dilution produisant une DO specifique de 0,5 
(difference entre DO mesuree sur lysat de cellules infectdes et DO mesur^e sur lysat 
de cellules non infectees) aprds relation par un anticorps polyclonal anti-IgG de 

25 souris couple a la peroxidase (NA931V, Amersham) et du TMB additionne de H 2 0 2 
(KPL) (figure 28A). 

Dans ces conditions, le plasmide d'expression pcDNA-S ne permet 
T induction que de faibles titres d'anticorps dirigees contre la S du SRAS-CoV chez 3 
souris sur 6 (LOGio(TI)=l,9±0,6) alors que le plasmide pcDNA-N permet l'induction 

30 d'anticorps anti-N a des titres 61ev6s (LOGio(TI)= 3,9±0,3) chez tous les animaux, et 
les plasmides controles (pCI, pCI-HA) n'entrainent aucun anticorps detectable 
(LOGio(TI)<l,7). Le plasmide pCI-S muni d'un signal d'6pissage permet l'induction 
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d'anticorps & des titres eleves (LOGi 0 (TI)= 3,7±0,2), qui sont environ 60 fois 
superieurs a ceux observes aprds injection du plasmide pcDNA-S (p<10' 5 ). 

L f efficacit6 des signaux post-transcriptionnels a et6 etudiee en 
r^alisant une 6tude dose-r6ponse des titres en anticorps anti-S induits chez la souris 
5 BALB/c en fonction de la quantite d'ADN plasmidique utilise comme immunogene 
(2|ag, 10 jig et 50 fxg). Cette 6tude (figure 28B) demontre que le signal post- 
transcriptionnel WPRE ameliore fortement l'efficacite de Timmunisation genique 
lorsque de faibles doses d'ADN sont utilisees (p<10" 5 pour une dose de 2 |ig d'ADN et 
p<10' 2 pour Tine dose de 10 fxg), alors que Teffet du signal CTE reste marginal (p=0,34 
10 pour une dose de 2 jag d'ADN). 

Enfin, les anticorps induits chez la souris apres immunisation 
genique neutralised l'infectivite du SRAS-CoV in vitro (figures 29A et 29B) a des 
titres qui sont en rapport avec les titres mesures par ELISA. 

En resume, Putilisation d'un signal d'6pissage et du signal post- 
15 transcriptionnel WPRE du virus de Ph£patite de la marmotte ameliore de fa9on 
considerable l'induction d'anticorps neutralisants diriges contre le SRAS-CoV apres 
immunisation genique a l'aide d'ADN plasmidique dirigeant l'expression du cADN 
de la S du SRAS-CoV. 

Exemple 13 : Applications diagnostiques de la proteine S 

20 La reactivite en ELISA du polypeptide recombinant Ssol a ete 

analysSe vis-&-vis de serums de patients atteints de SRAS. 

Les serums de cas probables de SRAS testes ont 6t6 choisis sur la 
base des r^sultats (positifs ou negatifs) d'analyse de leur reactivite sp^cifique vis-a-vis 
des antig£nes natifs du SRAS-CoV par test d' immunofluorescence sur cellules 

25 VeroE6 infectSes par le SRAS-CoV et/ou par test ELISA indirect en utilisant comme 
antigene un lysat de cellules VeroE6 infectees par le SRAS-CoV. Les scrums de ces 
patients sont identifies par un num6ro d'ordre du Centre National de Reference des 
Virus Influenzae ainsi que par les initiales du patient et le nombre de jours £coules 
depuis le debut des symptomes. Tous les serums de cas probables (cf Tableau XII) 

30 reconnaissent les antigenes natifs du SRAS-CoV, a l'exception du serum 032552 du 
patient VTT, pour lequel l'infection par le SRAS-CoV n'a pas pu etre confirmee par 
RT-PCR r6alis6e sur pr61evements respiratoires des jours 3, 8 et 12. Un panel de 
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serums temoin a £te utilise a titre de controle (scrums TV): il s'agit de serums pr&eves 
en France avant Pepidemie de SRAS survenue en 2003. 
Tableau XII : serums de cas probables de SRAS 



serum 


patient 


jour de prelevement 


031724 


JYK 


7 


033168 


JYK 


38 


033597 


JYK 


74 


032632 


NTM 


17 


032634 


THA 


15 


032541 


PHV 


10 


032542 


NIH 


17 


032552 


VTT 


8 


032633 


PTU 


16 


032791 


J LB 


3 


033258 


J LB 


27 


032703 


JCM 


8 


033153 


JCM 


29 



5 Des phases solides sensibilisees par le polypeptide recombinant Ssol 

ont 6t€ preparees par adsorption d'une solution de polypeptide Ssol purifie a 2 ^ig/ml 
en PBS dans les puits d'une plaque ELISA, puis les plaques sont incubees vme nuit k 
4°C et lavees avec du tampon PBS-Tween (PBS, 0,1% Tween20). Apres saturation 
des plaques ELISA par une solution de PBS-lait ecreme k 10% (poids/volume) et 

10 lavage en PBS-tween, les scrums a tester (100 \xl) sont dilu6s au 1/400 dans du tampon 
PBS-lait ecr6me-Tween (PBS, 3% lait <§crem6, 0,1% Tween) puis ajoutes dans les 
puits de la plaque ELISA sensibilis£e. Les plaques sont incubees lh a 37°C. Apr6s 3 
lavages avec du tampon PBS-Tween, le conjuguS anti-IgG humaines marqu£ a la 
peroxidase (r6f NA933V, Amersham) dilue au 1/4000 dans du tampon PBS-lait 

15 6crem6-Tween est ajout6, puis les plaques sont incubees une heure k 37°C. Apres 6 
lavages avec du tampon PBS-Tween, le chromogene (TMB) et le substrat (H 2 0 2 ) sont 
ajoutes et les plaques sont incubees 10 minutes a Pabri de la lumiere. La reaction est 
arr&ee par ajout d'une solution IN de H3PO4, puis Pabsorbance est mesuree k 450 nm 
avec un reference k 620nm. 
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Les tests ELISA (figure 30) d&nontrent que le polypeptide 
recombinant Ssol est reconnu specifiquement par les anticorps sSriques de patients 
atteints de SRAS preleves en phase moyenne ou tardive de l'infection (> 10 jours 
apr6s le dSbut des symptomes alors qu'il n'est pas reconnu de fa9on significative par 
5 les anticorps s^riques de deux patients (JLB et JCM) preleves en phase pr6coce de 
Tinfection (3 a 8 jours apres le d6but des symptomes) ni par des serums temoins de 
sujets non atteints de SRAS. Les anticorps s6riques des patients JLB et JCM montrent 
une seroconversion entre les jours 3 et 27 pour le premier et 8 et 29 pour le second 
apres le d6but des symptomes, ce qui confirme la specificity de la reactivity de ces 

1 0 scrums vis-a-vis du polypeptide Ssol. 

En conclusion, ces resultats demontrent que le polypeptide 
recombinant Ssol peut etre utilise comme antigene pour la mise au point d'un test 
ELISA de diagnostic serologique de Tinfection par le SRAS-CoV. 
Exemple 14 : Applications vaccinates de la proteine S soluble recombinante 

15 L'immunogenicite du polypeptide recombinant Ssol a 6t6 6tudiee 

chez la souris. 

Pour cela, un groupe de 6 souris a ete immunise h 3 semaines 
d'intervalle avec 10 jag de polypeptide recombinant Ssol adjuve par 1 mg d'hydroxyde 
d'aluminium (Alu-gel-S, Serva) dilu6 en PBS. Trois immunisations successives ont 

20 6t6 realisees et les serums immuns ont &t& preleves 3 semaines apres chacune des 
immunisations (IS1, IS2 3 IS3). A titre de controle, un groupe de souris (groupe mock) 
a re9U de Thydroxide d'aluminium seul selon le m6me protocole. 

Les scrums immuns ont ete analyses par pool pour chacun des 2 
groupes par ELISA indirect en utilisant un lysat de cellules VeroE6 infectees par le 

25 SRAS-CoV comme antigene et k titre de controle, un lysat de cellules VeroE6 non 
infectees. Les titres en anticorps anti-SRAS-CoV sont calculus comme l'inverse de la 
dilution produisant une DO specifique de 0,5 aprds relation par un anticorps 
polyclonal anti-IgG(H+L) de souris coupte k la peroxidase (NA931V, Amersham) et 
du TMB additionn6 de H2O2 (KPL). Cette analyse (figure 31) montre que 

30 T immunisation par le polypeptide Ssol induit chez la souris des la premiere 
immunisation des anticorps diriges contre la forme native de la proline de spicule du 
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SRAS-CoV pr£sente dans le lysat de cellules VeroE6 infectees. Aprfes 2 puis 3 
immunisations, les titres en anticorps anti-S deviennent tr6s eleves. 

Les serums immuns ont 6te analyses par pool pour chacun des 2 
groupes pour leur capacity a s6roneutraliser l'infectivite du SRAS-CoV. 4 points de 
5 s6roneutralisation sur cellules FRhK-4 (100 TCID50 de SRAS-CoV) sont r&dis&3 
pour chacune des dilutions de raison 2 testees k partir du 1/20. Le titre s&roneutralisant 
est calcule selon la m&hode de Reed et Munsch comme T inverse de la dilution 
neutralisant l'infectivite de 2 cupules sur 4. Cette analyse montre que les anticorps 
induits chez la souris par le polypeptide Ssol sont neutralisants : les titres observes 

10 sont tres eleves apres 2 puis 3 immunisations (sup6rieurs k 2560 et 5120 
respectivement, Tableau XIII). 

Tableau XIII : induction d'anticorps diriges contre le SRAS- 
CoV apres immunisation avec le polypeptide recombinant Ssol. Les s6rums 
immuns ont et6 analyses par pool pour chacun des 2 groupes pour leur capacity a 

15 sSroneutraliser l'infectivite de 100 TCID50 du SRAS-CoV sur cellules FRhK-4. 4 
points sont realis6s pour chacune des dilutions de raison 2 testees a partir du 1/20. Le 
titre s&roneutralisant est calcule selon la m&hode de Reed et Munsch comme Pinverse 
de la dilution neutralisant l'infectivite de 2 cupules sur 4. 



groupe 


serums 


Ac. Neutralisants 


Mock 


Pi 


< 20 


IS1 


< 20 


IS2 


< 20 


IS3 


< 20 


Ssol 


PI 


< 20 


IS1 


57 


IS2 


> 2560 


IS3 


> 5120 



20 Les titres neutralisants observes chez les souris immunisees avec le 

polypeptide Ssol atteignent des niveaux tres sup6rieurs aux titres observes par Yang et 
coll. chez la souris (2004, Nature, 428: 561-564) et a ceux observes par Buchholz chez 
le hamster (2004, PNAS 101 : 9804-9809), qui protegent respectivement la souris et le 
hamster de Tinfection par le SRAS-CoV. II est done vraisemblable que les anticorps 
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neutralisants induits chez la souris aprfes immunisation par le polypeptide Ssol 
protegent ces animaux contre P infection par le SRAS-CoV. 

Exemple 15 : Gene synthetique optimise pour 1' expression en cellules de 
mammiferes de la proteine de spicule (S) du coronavirus associe au SRAS 
5 (SRAS-CoV). 

1) Conception du gene synthetique 

Un g&ie synthetique codant pour la proteine de spicule du SRAS- 

CoV a ete con?u a partir du gene de Pisolat 031589 (plasmide pSARS-S, C.N.C.M . 
n° 1-3059) de fa9on a permettre des niveaux d 9 expression elev£s dans des cellules de 
10 mammiferes et en particulier dans les cellules d'origine humaine. 

Pour cela : 

- Pusage des codons du gene sauvage de Pisolat 031589 a ete 
modifie de fa9on k se rapprocher du biais observe chez Phomme et a ameliorer 
Pefficacite de traduction du mRNA correspondant 

15 - le contenu global en GC du gene a ete augments de fa?on k 

prolonger la demi-vie du mRNA correspondant 

- les motifs, eventuellement cryptiques, susceptibles d'interferer 
avec une expression efficace du g£ne ont ete supprimes (sites donneurs et accepteurs 
d'epissage, signaux de polyadenylation, sequences tres riches (>80%) ou tres pauvres 

20 (<30%) en GC, sequences repetees, sequences impliquees dans la formation de 
structures secondares de PARN, boites TATA) 

- un deuxieme codon STOP a ete ajoute pour permettre une 
terminaison efficace de la traduction. 

En outre, des motifs CpG ont ete introduits dans le gene de fa9on k 
25 augmenter son immunog&iicitS comme vaccin a ADN. Afin de faciliter la 
manipulation du gene synthetique, deux sites de restriction BamHl et Xhol ont ete 
places de part et d'autre de la phase ouverte de lecture de la proline S, et les sites de 
restriction BamHl, Xhol, Nhel, Kpnl, BspEl et Sail ont <§te £vit6s dans le gene 
synth&ique. 

30 La sequence du gene synthetique con9u (g£ne 040530) est donnee en 

SEQ ID No: 140. 
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Un alignement du gene synthetique 040530 avec la sequence du 
gene sauvage de l'isolat 031589 du SRAS-CoV depose k la C.N.CM. sous le numero 
1-3059 (SEQ ID NO : 4, plasmide pSRAS-S) est presente dans la figure 32. 

2) Constructions plasmidiques 

5 Le g£ne synthetique SEQ ID No: 140 a ete assemble a partir 

d' oligonucleotides synthetiques et clone entre les sites Kpnl et Sacl du plasmide 
pUC-Kana pour donner le plasmide 040530pUC-kana. La sequence nucieotidique de 
Pinsert du plasmide 040530pUC-kana a 6t6 v&ifiee par sequen9age automatique 
(Applied). 

10 Un fragment Kpnl-Xhol contenant le gene synthetique 040530 a 6te 

excise du plasmide 040530pUC-kana et sous-clone entre les sites Nhel et Xhol du 
plasmide d'expression pCI (Promega) pour obtenir le plasmide pCI-SSYNTH, depose a 
la CNCM le l er decembre 2004, sous le numero 1-3333. 

Un gene synthetique codant pour la forme soluble de la proteine S a 

15 ensuite ete obtenu en fusionnant les sequences synthetiques codant pour 
Tectodomaine de la proline S (acides amines 1 a 1193) a celles de Tetiquette (FLAG 
: DYKDDDDK) via un linker BspEl codant pour le dipeptide SG. Pratiquement, un 
fragment d'ADN codant pour l'ectodomaine de la S du SRAS-CoV a ete amplifie par 
PCR a l'aide des oligonucleotides 5 ACTAGCTAGC GGATCCA CCA 

20 TGTTCATCTT CCTG -3' et 5'- AGT ATCCGGA C TTGATGTACT GCTCGTACTT 
GC-3 7 a partir du plasmide 040530pUC-kana, digere par Nhel et BspEl puis insere 
entre les sites uniques Nhel et BspEl du plasmide pCI-Ssol, pour donner le plasmide 
pCI-ScUBE, depose k la CNCM le l er decembre 2004, sous le numero 1-3332. (Les 
plasmides pCI-Ssol, pCI-Ssol-CTE et pCI-Ssol-WPRE (depose k la CNCM, le 22 

25 novembre 2004, sous le numero 1-3324) avaient ete precedemment obtenus par sous- 
clonage du fragment Kpnl-Xhol excise du plasmide pcDNA-Ssol (voir note 
technique de la DI 2004-106) entre les sites Nhel et Xhol des plasmides pCI, pCI-S- 
CTE et pCI-S-WPRE respectivement.) 

Les plasmides pCI-Scube et pCI-Ssol codent pour le meme 

30 polypeptide recombinant Ssol. 

3) Resultats 
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La capacity du gene synth£tique codant pour la proline S k dinger 
efficacement V expression de la S du SRAS-CoV dans des cellules de mammiferes a 
ete compare a celle du gene sauvage apres transfection transitoire de cellules de 
primates (VeroE6) et de cellules humaines (293T). 
5 Dans Pexp&ience presentee par la figure 33 et au Tableau XIV, des 

monocouches de 5xl0 5 cellules VeroE6 ou 7xl0 5 cellules 293T en boites de Petri de 
35mm ont ete transferees avec 2 \ig des plasmides pCI (a titre de controle), pCI-S, 
pCI-S-CTE, pCI-S-WPRE et pCI-Ssynth et 6 \xl de r<§actif Fugene6 selon les 
indications du fabricant (Roche). Apres 48 heures d'incubation a 37°C et sous 5% de 

10 CO2, des extraits cellulaires ont ete prepares en tampon de depdt selon Laemmli, 
s6par6s sur un gel SDS a 8% de polyacrylamide puis transf&r^s sur une membrane de 
PVDF (BioRad). La detection de cette immunoempreinte (« western blot») a ete 
r6alis£e a l'aide d'un serum polyclonal de lapin anti-S (immun-s6rum du lapin 
PI 1135 : cf exemple 4 ci-dessus) et d'anticorps polyclonaux d'ane diriges contre les 

15 IgG de lapin et couples a la peroxidase (NA934V, Amersham). L' immunoempreinte 
est revelee de fa?on quantitative par luminescence a Taide du kit ECL+ (Amersham) 
et acqxxisition sur un dispositif d'imagerie numerique (FluorS, BioRad). 

L'analyse des resultats obtenus avec le logiciel QuantityOne v4.2.3 
(BioRad) montre que dans cette experience, le plasmide pCI-Synth permet 

20 T expression transitoire de la proteine S a des niveaux eleves dans les cellules VeroE6 
et 293T, alors que le plasmide pCI-S ne permet pas d'induire une expression & des 
niveaux suffisants pour etre detectee. Les niveaux d'expression observes sont de 
l'ordre de 2 fois superieurs a ceux observes avec le plasmide pCI-S-WPRE. 
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Tableau XIV : utilisation d'un gfcne synth&ique pour Pexpression de la S du 
SRAS-CoV. Des extraits cellulaires prepares 48 heures apr6s transfection de 
cellulesVeroE6 ou 293T par les plasmides pCI, pCI-S, pCI-S-CTE, pCI-S-WPRE et 
pCI-Ssynth ont 6t6 separes sur un gel SDS a 8% d'acrylamide et analyses par western 
5 blot a Paide d'un anticorps polyclonal de lapin anti-S et d'un anticorps polyclonal 
anti-IgG(H+L) de lapin couple k la peroxidase (NA934V, Amersham). Le western 
blot est revele par luminescence (ECL+, Amersham) et acquisition sur un dispositif 
d'imagerie num&ique (FluorS, BioRad). Les niveaux d'expression de la proteine S 
ont 6te mesures en quantifiant les 2 bandes majoritaires rep6r6es sur V image (voir 
10 figure 33) et sont indiques en fonction d'une echelle arbitraire ou la valeur de 1 
repr6sente le niveau mesur6 apres transfection du plasmide pCI-S-WPRE. 



plasmide 


VeroE6 


293T 


pCI 


0,0 


0,0 


pCI-S 


< 0,1 


< 0,1 


pCI-S-CTE 


0,5 


< 0,1 


pCI-S-WPRE 


1,0 


1,0 


PCI-Ssynth 


1,8 


1,9 



Dans un second temps, la capacite du gene synth&ique Scube k 
diriger efficacement la synthese et la s£cr6tion du polypeptide Ssol par des cellules de 

15 mammiferes a 6te compare k celle du gene sauvage apres transfection transitoire de 
cellules de hamster (BHK-21) et de cellules humaines (293T). 

Dans l'experience pr£sent£e par le Tableau XV, des monocouches 
de 6xl0 5 cellules BHK-21 et de 7xl0 5 cellules 293T en boites de Petri de 35mm ont 
6t6 transferees avec 2 jug des plasmides pCI (k titre de controle), pCI-Ssol, pCI-Ssol- 

20 CTE, pCI-Ssol-WPRE et pCI-Scube et 6 |il de r<§actif Fugene6 selon les indications du 
fabricant (Roche). Apres 48 heures d'incubation k 37°C et sous 5% de C02, les 
surnageants cellulaires ont €\€ pr61ev6s et analyses de fa9on quantitative pour la 
s6cr6tion du polypeptide Ssol par un test ELISA-capture specifique du polypeptide 
Ssol. 

25 L' analyse des rSsultats montre que, dans cette experience, le 

plasmide pCI-Scube permet Pexpression du polypeptide Ssol k des niveaux 8 fois 
(cellules BHK-21) a 20 fois (cellules 293T) plus 61ev6s que le plasmide pCI-SsoL Les 
niveaux d'expression observes sont de Tordre de 2 fois (cellules 293T) k 5 fois 
(cellules BHK-21) superieurs k ceux observes avec le plasmide pCI-Ssol-WPRE. 

30 
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Tableau XV : utilisation d'un gfcne synthetique pour P expression du polypeptide 
Ssol. Les surnageants ont 6t6 r£coltes 48 heures apr6s transfection de cellules BHK ou 
293T par les plasmides pCI, pCI-Ssol, pCI-Ssol-CTE, pCI-Ssol-WPRE et pCI-Scube 
et analyses de fa9on quantitative pour la s6cr6tion du polypeptide Ssol par un test 
5 ELISA-capture sp^cifique du polypeptide Ssol. Les transfections ont ete realisees en 
dupliqu6s et les r^sultats sont indiqu6s sous la forme de moyennes et 6cart-types des 
concentrations de polypeptide Ssol (ng/ml) mesurees dans les surnageants. 



Plasmide 


BHK 


293T 


Pci 


< 20 


< 20 


pCI-Ssol 


< 20 


56 ± 10 


pCI-Ssol-CTE 


< 20 


63 ± 8 


pCI-Ssol-WPRE 


28 ± 1 


531 ± 15 


PCI-Scube 


152 ± 6 


1140 ± 20 



10 En resume, ces rdsultats montrent que 1' expression dans des cellules 

de mammiferes du gene synthetique 040530 codant pour la S du SRAS-CoV sous la 
dependance de sequences promotrices de TARN polymerase II est bien plus efficace 
que celle du gene sauvage de l'isolat 031589. Cette expression est meme plus efficace 
que celle dirigee par le gene sauvage en presence des sequences WPRE du virus de 

1 5 PhSpatite de la marmotte. 
4) Applications 

L'utilisation du gene synthetique 040530 codant pour la S du SRAS- 
CoV ou de sa variante Scube codant pour le polypeptide Ssol est susceptible de 
remplacer avantageusement le gene sauvage dans de nombreuses applications oil 
20 Pexpression de la S est necessaire a des niveaux 61ev£s. En particulier pour : 

- ameliorer Tefficacite de T immunisation genique par des plasmides 
du type pCI-Ssynth voire pCI-Ssynth-CTE ou pCI-Ssynth-WPRE 

- 6tablir de nouvelles lign6es cellulaires exprimant des quantites plus 
elev6es de la proteine S ou du polypeptide Ssol a l'aide de vecteurs lentiviraux 

25 recombinants porteurs du gene Ssynth ou du g6ne Scube respectivement 

- ameliorer T immunogenic^ des vecteurs lentiviraux recombinants 
permettant l'expression de la proteine S ou du polypeptide Ssol 

- ameliorer Pimmunogenicite de vecteurs vivants permettant 
Pexpression de la proteine S ou du polypeptide Ssol comme des virus recombinants de 

30 la vaccine ou des virus rougeole recombinants (voir exemples 16 et 17 ci-apres) 
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Exemple 16 : Expression de la proteine de spicule (S) du coronavirus associe au 
SRAS (SRAS-CoV) a Taide de virus recombinants de la Vaccine. 
Application vaccinale. 

Application a la production d'une forme soluble de la proteine de spicule (S) et 
5 conception d'un test de serologic du SRAS. 
1) Introduction 

Le but de cet exemple est d'evaluer la capacity de virus 
recombinants de la vaccine (VV) exprimant differents antigenes du coronavirus 
associe au SRAS (SRAS-CoV) k constituer de nouveaux candidats vaccins contre le 
10 SRAS et un moyen de produire des antigenes recombinants en cellules de 
mammiferes. 

Pour cela, les inventeurs se sont int6ress6s k la proline de spicixle 
(S) du SRAS-CoV, qui permet d'induire aprds immunisation genique chez Tanimal 
des anticorps neutralisants Pinfectivit6 du SRAS-CoV, ainsi qu'a une forme soluble et 

15 secret^e de cette proteine, le polypeptide Ssol, qui est compost de Pectodomaine (aa 
1-1 193) de la S fusionn^ en son extr&nit6 C-ter a une etiquette FLAG (DYKDDDDK) 
via un linker BspEl codant pour le dipeptide SG. Ce polypeptide Ssol presente ime 
antigenicity similaire h celle de la proteine S et permet, apres injection a la souris sous 
la forme d'une proteine purifiee adjuvee en hydroxide d'aluminium, Pinduction de 

20 titres 61ev6s d' anticorps neutralisants contre le SRAS-CoV. 

Les differentes formes du g£ne S ont 6t6 placees sous la d6pendance 
du promoteur du gene 7.5K puis introduces au sein du locus de la thymidine kinase 
(TK) de la souche Copenhague du virus de la vaccine par double recombinaison 
homologue in vivo. Afin d'am&iorer Pimmunogenicit6 des virus vaccine 

25 recombinants, un promoteur tardif synthetique a 6te choisi a la place du promoteur 
7.5K, pour augmenter la production de S et Ssol au cours des phases tardives du cycle 
viral. 

Apres avoir isole les virus vaccine recombinants et verifie leur 
capacity a exprimer Pantigene S du SRAS-CoV, leur capacity a induire chez la souris 
30 une reponse immunitaire contre le SRAS a 6t6 testee. Apres avoir purifte Pantigene 
Ssol du surnageant de cellules infect6es, un test ELISA de s6rodiagnostic du SRAS a 
6t6 con9u, et son efficacit6 a 6t6 6valu6e a Paide de scrums de cas probables de SRAS. 
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2) Construction des virus recombinants 

Des virus recombinants de la vaccine dirigeant P expression de la 
glycoprotein S de Pisolat 031589 du SRAS-CoV et d'une forme soluble et secretee 
de cette proline, le polypeptide Ssol, sous la dependance du promoteur 7.5K ont 6t6 
5 obtenus. Dans le but d'augmenter les niveaux d'expression de S et Ssol, des virus 
recombinants dans lesquels les cDNA de S et de Ssol sont places sous la dependance 
d'un promoteur synthetique tardif ont egalement ete obtenus. 

Le plasmide pTG186poly est un plasmide de transfert pour la 
construction de virus recombinants de la vaccine (Kieny, 1986, Biotechnology, 

10 4 :790-795). A ce titre, il contient le gene de la thymidine kinase du W dans lequel a 
6t6 insere le promoteur du gene 7.5K suivi d'un site multiple de clonage permettant 
Tinsertion de genes h^terologues (figure 34A). Le promoteur du gene 7.5K contient en 
fait un tandem de deux sequences promotrices actives respectivement durant les 
phases precoces (Pe) et tardives (Pl) du cycle de replication du virus de la vaccine. 

15 Les fragments BamHl-Xhol ont ete excises des plasmides pTRIP-S et pcDNA-Ssol 
respectivement et inseres entre les sites BamHl et Smal du plasmide pTG186poly 
pour donner les plasmides pTG-S et pTG-Ssol (figure 34A). Les plasmides pTG-S et 
pTG-Ssol ont ete deposes a la CNCM, le 2 decembre 2004, sous les numeros 1-3338 et 
1-3339, respectivement. 

20 Les plasmides pTN480, pTN-S et pTN-Ssol ont ete obtenus a partir 

des plasmides pTG186poly, pTG-S et pTG-Ssol respectivement, en substituant le 
fragment Ndel-Pstl contenant le promoteur 7.5K par un fragment d'ADN contenant 
le promoteur tardif synthetique 480, qui a ete obtenu par hybridation des 
oligonucleotides 5'- TATGAGCTTT TTTTTTTTTT TTTTTTTGGC 

25 ATATAAATAG ACTCGGCGCG CCATCTGCA-3' et 5'- GATGGCGCGC 
CGAGTCTATT TATATGCCAA AAAAAAAAAA AAAAAAAAGC TCA-3' 
(figure 34B). L'insert a ete sequence a Paide d'un kit BigDye Terminator vl.l 
(Applied Biosystems) et d'un sequenceur automatique ABI377. La sequence du 
promoteur synthetique tardif 480 tel que clone dans les plasmides de transfert de la 

30 serie pTN est indiquee figure 34C. Les plasmides pTN-S et pTN-Ssol ont ete deposes 
k la CNCM, le 2 decembre 2004, sous les numeros 1-3340 et 1-3341, respectivement. 
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Les virus recombinants de la vaccine ont 6t6 obtenus par double 
recombinaison homologue in vivo entre la cassette TK des plasmides de transfert des 
series pTG et pTN et le g6ne TK de la souche Copenhague du virus de la vaccine 
selon une procedure decrite par Kieny et coll. (1984, Nature, 312: 163-166). 
5 Bridvement, des cellules CV-1 sont transferees k Paide de DOTAP (Roche) par de 
PADN g&iomique de la souche copenhague du virus de la vaccine et chacun des 
plasmides de transfert des series pTG et pTN d6crits ci-dessus, puis surinfect6es par le 
virus vaccine auxiliaire W-ts7 pendant 24 heures a 33°C. Le virus auxiliaire est 
contre-selectionne par incubation a 40°C pendant 2 jours puis les virus recombinants 

10 (phenotype TK-) s&ectionnes par deux cycles de clonage sous milieu g&ose sur 
cellules 143Btk- en presence de BuDr (25 jig/ml). Les 6 virus VV-TG, VV-TG-S, 
VV-TG-Ssol, VV-TN, VV-TN-S et VV-tN-Ssol ont ete respectivement obtenus k 
Paide des plasmides de transfert pTG186poly, pTG-S, pTG-Ssol, pTN480, pTN-S, 
pTN-SsoI. Les virus W-TG et VV-TN n'expriment aucun gene h6t6rologue et ont et6 

15 utilises comme contrdle TK- dans les experiences. Les preparations de virus 
recombinants ont ete realises sur monocouches de cellules CV-1 ou BHK-21 et le titre 
en unites formant plage (u.f.p.) determine sur cellules CV-1 selon Earl et Moss (1998, 
Current Protocols in Molecular Biology, 16.16.1-16.16.13). 
3) CaractSrisation des virus recombinants 

20 L'expression des transgenes codant la proteine S et le polypeptide 

Ssol a 6t6 recherchee par western blot. 

Des monocouches de cellules CV-1 ont ete infectees k une 
multiplicity de 2 par les difterents virus vaccine recombinants VV-TG, VV-TG-S, 
W-TG-Ssol, VV-TN, VV-TN-S et VV-TN-Ssol. Apres 18 heures d'incubation k 

25 37°C et sous 5% de C02, des extraits cellulaires ont ete prepares en tampon de depot 
selon Laemmli, s£par6s sur un gel SDS a 8% de polyacrylamide puis transfers sur 
une membrane de PVDF (BioRad). La d6tection de cette immunoempreinte (« western 
blot ») a 6te realis^e a Paide d'im serum polyclonal de lapin anti-S (immun-s^rum du 
lapin PI 1135 : cf exemple 4) et d'anticorps polyclonaux d'ane dirig^s contre les IgG 

30 de lapin et couples a la peroxidase (NA934V, Amersham). Les anticorps fixes ont 6t& 
r6vel6s par luminescence k Paide du kit ECL+ (Amersham) et de films 
d'autoradiographie Hyperfilm MP (Amersham). 
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Comme le montre la figure 3 5 A, le virus recombinant VV-TN-S 
dirige r expression de la proteine S & des niveaux qui sont comparables a ceux que 
Ton peut observer 8h aprds infection par le SRAS-CoV mais qui sont bien plus 61ev6s 
que ceux que Ton peut observer apres infection par VV-TG-S. Dans une deuxieme 
5 experience (figure 35B), P analyse de quantites variables d'extraits cellulaires montre 
que les niveaux d'expression observes aprds infection par les virus de la s&ie TN 
(W-TN-S et VV-TN-Ssol) sont environ 10 fois plus elev6s que ceux observes avec 
les virus de la serie TG (W-TG-S et W-TG-Ssol respectivement). En outre, le 
polypeptide Ssol est secrete dans le surnageant de cellules CV-1 infectSes par le virus 

10 VV-TN-Ssol plus efficacement que dans le surnageant de cellules infectees par W- 
TG-Ssol (figure 36A). Dans cette experience, le virus W-TN-Sflag a 6t6 utilise a titre 
de controle, car il exprime la forme membranaire de la proteine S fusionnSe en son 
extremite C-ter k Petiquette FLAG. La proteine Sflag n'est pas detect^e dans le 
surnageant des cellules infectees par VV-TN-Sflag, demontrant que le polypeptide 

15 Ssol est bien secrete de fa9on active aprds infection par W-TN-Ssol. 

Ces r6sultats demontrent que les virus vaccine recombinants sont 
bien porteurs des transgenes et permettent l'expression de la glycoproteine du SRAS 
sous sa forme membranaire (S) ou sous une forme soluble et secr&ee (Ssol). Les virus 
vaccine porteurs du promoteur synth6tique 480 permettent l'expression de S et la 

20 secretion de Ssol k des niveaux bien plus 61ev6s que les virus porteurs du promoteur 
du g6ne 7.5K. 

4) Application h la production d'une forme soluble de la S du SRAS-CoV. 
Purification de cet antigene recombinant et applications diagnostiques. 

La lignSe BHK-21 est la lignee cellulaire qui secrete les quantit6s les 
25 plus 61ev6es de polypeptide Ssol aprds infection par le virus W-TN-Ssol parmi les 
ligntSes testees (BHK-21, CV1, 293T et FrhK-4, figure 36B) ; elle permet la 
production et la purification en quantity du polypeptide recombinant Ssol. Dans une 
experience type ou les conditions experimentales d'infection, de production et de 
purification ont 6t6 optimises, les cellules BHK-21 sont ensemencSes en milieu de 
30 culture standard (DMEM sans pyruvate contenant 4.5g/l de glucose et supplements 
par 5% de TPB, 5% de SVF, 100 U/ml de penicilline et 100 ^ig/ml de streptomycine) 
sous la forme d'une monocouche sous-confluente (10 millions de cellules pour chaque 
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100 cm 2 dans 25 ml de milieu). Apr&s 24h d'incubation a 37°C sous 5% de CO2, les 
cellules sont infectees k une M.OJ. de 0.03 et le milieu standard remplac^ par le 
milieu de secretion ou la quantite de SVF est abaiss^e k 0.5% et le TPB supprim6. Le 
sumageant de culture est prelev6 apres 2,5 jours d'incubation a 35°C et sous 5% de 
5 CO2 et le virus de la vaccine inactive par addition de triton X-100 (0,1%). Apr6s 
filtration sur membrane de polyethersulfone (PES) de 0.1 jim, le polypeptide 
recombinant Ssol est purifie par une chromatographic d'affinite sur matrice anti- 
FLAG avec Slution par une solution de peptide FLAG (DYKDDDDK) a 100 jag/ml en 
TBS (Tris 50mM pH 7.4, 150 mMNaCl). 

10 L'analyse par gel SDS k 8 % d'acrylamide colors au nitrate d'argent 

a mis en 6vidence un polypeptide majoritaire dont la masse moteculaire est d'environ 
180kD et dont le degre de purete est sup&ieur k 90% (figure 37).La concentration du 
polypeptide recombinant Ssol purifte a ete determine par comparaison avec les 
marqueurs de masse moteculaire et estimee k 24 ng/|ul. 

15 Cette preparation de polypeptide Ssol purifie permet de realiser une 

gamme 6talon pour mesurer a Taide d'un test ELISA-capture les concentrations de 
Ssol presentes dans les surnageants de culture. Selon ce test, la lign6e BHK-21 secrete 
environ 1 ng/ml de polypeptide Ssol dans les conditions de production decrites plus 
haut. En outre, le schema de purification presents permet de purifier de l'ordre de 160 

20 |ig de polypeptide Ssol par litre de surnageant de culture. 

La reactivite en ELISA du polypeptide recombinant Ssol a ete 
analys6e vis-^-vis de serums de patients atteints de SRAS. 

Les scrums de cas probables de SRAS testes ont 6t€ choisis sur la 
base des resultats (positifs ou n^gatifs) d'analyse de leur reactivity specifique vis k vis 

25 des antigenes natifs du SRAS-CoV par test d'immunofluorescence sur cellules 
VeroE6 infectees par le SRAS-CoV et/ou par test ELISA indirect en utilisant comme 
antigene un lysat de cellules VeroE6 infectees par le SRAS-CoV. Les serums de ces 
patients sont identifies par un numero d'ordre du Centre National de Reference des 
Virus Influenzae ainsi que par les initiales du patient et le nombre de jours 6coul6s 

30 depuis le d6but des symptomes. Tous les scrums de cas probables (cf Tableau XVI) 
reconnaissent les antigenes natifs du SRAS-CoV k l'exception du serum 032552 du 
patient VTT, pour lequel Finfection par le SRAS-CoV n'a pas pu etre confirmee par 
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RT-PCR r^alisee sur pr616vements respiratoires des jours 3, 8 et 12. Un panel de 
serums t&noin a 6t6 utilise k titre de controle (scrums TV): il s'agit de serums pr61ev6s 
en France avant l'6pid6mie de SRAS survenue en 2003. 

5 Tableau XVI : serums de cas probables de SRAS 



10 



serum 


patient 


jour de prelevement 


033168 


JYK 


38 


033597 


JYK 


74 


032632 


NTM 


17 


032634 


THA 


15 


032541 


PHV 


10 


032542 


NIH 


17 


032552 


VTT 


8 


032633 


PTU 


16 



Des phases solides sensibilisSes par le polypeptide recombinant Ssol 
ont 6t€ pr^parees par adsorption d'une solution de polypeptide Ssol purifi6 a 4 fig/ml 
en PBS dans les puits d'une plaque ELISA. Les plaques sont incubees une nuit a 4°C 
puis lavees avec du tampon PBS-Tween (PBS, 0,1% Tween20). Apres lavage en 
PBS-tween, les serums a tester (100 fxl) sont dilu6s au 1/100 et 1/400 dans du tampon 
PBS-lait ecr6m6-Tween (PBS, 3% lait Screme, 0,1% Tween) puis ajoutes dans les 
puits de la plaque ELISA sensibilisSe. Les plaques sont incubees lh a 37°C. Apres 3 
lavages avec du tampon PBS-Tween, le conjugue anti-IgG humaines marque a la 
15 peroxidase (ref NA933V, Amersham) dilue au 1/4000 dans du tampon PBS-lait 
6cr6m6-Tween est ajoutS puis les plaques sont incubees une heure a 37°C. Apres 6 
lavages avec du tampon PBS-Tween, le chromogdne (TMB) et le substrat (H 2 0 2 ) sont 
ajoutes et les plaques sont incubees 10 minutes a Fabri de la lumiere. La reaction est 
arrStee par ajout d'une solution 1M de H3PO4 puis l'absorbance est mesur^e a 450 nm 
20 avec une reference k 620nm. 

Les tests ELISA (figure 38) d&nontrent que le polypeptide 
recombinant Ssol est reconnu spScifiquement par les anticorps seriques de patients 
atteints de SRAS preleves en phase moyenne ou tardive de l'infection (> 10 jours 
aprds le debut des symptdmes), alors qu'il n'est pas reconnu de fa9on significative par 
25 les anticorps seriques des serums tSmoins de sujets non atteints de SRAS. 
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En conclusion, ces r6sultats d&nontrent que le polypeptide 
recombinant Ssol peut etre purifte k partir du surnageant de cellules de mammif&res 
infectees par le virus vaccine recombinant VV-TN-Ssol et etre utilise comme antigene 
pour la mise au point d'un test ELISA de diagnostic s6rologique de l'infection par le 
5 SRAS-CoV. 

5) Applications vaccinales 

L'immunogenicite des virus vaccine recombinants a 6t6 etudtee chez 

la souris. 

Pour cela, des groupes de 7 souris BALB/c ont 6t6 immunises par 

10 voie i.v. a deux reprises k 4 semaines d'intervalle par 10 6 u.f.p. de virus vaccine 
recombinants VV-TG, VV-TG-S, VV-TG-Ssol, W-TN, W-TN-S et W-TN-Ssol 
ainsi que, k titre de contrSle, W-TG-HA qui dirige F expression de Ph6magglutinine 
de la souche A/PR/8/34 du virus de la grippe. Les scrums immuns ont 6t6 preleves 3 
semaines apres chacune des immunisations (IS1, IS2). 

15 Les scrums immuns ont 6t6 analyses par pool pour chacun des 

groupes par ELISA indirect en utilisant un lysat de cellules VeroE6 infectees par le 
SRAS-CoV comme antigene et a titre de controle, un lysat de cellules VeroE6 non 
infectees. Les titres (TI) en anticorps anti-SRAS-CoV sont calculus comme l'inverse 
de la dilution produisant une DO sp^cifique de 0,5 apres revelation par un anticorps 

20 polyclonal anti-IgG(H+L) de souris coupte a la peroxidase (NA931V, Amersham) et 
du TMB additionn6 de H 2 0 2 (KPL). Cette analyse (figure 39A) montre que 
rimmunisation par le virus W-TG-S et VV-TN-S induit chez la souris des la 
premiere immunisation des anticorps diriges contre la forme native de la proline de 
spicule du SRAS-CoV pr6sente dans le lysat de cellules VeroE6 infectees. Les 

25 r^ponses induites par le virus W-TN-S sont plus elev^es que celles induites par le 
virus VV-TG-S apr6s la premiere (TI=740 et TI=270 respectivement) et la deuxieme 
(TI=3230 et TI=600 respectivement) immunisation. Le virus W-TN-Ssol induit de 
forts titres d 5 anticorps anti-SRAS-CoV apres deux immunisations (TI=640), alors que 
le virus VV-TG-Ssol induit une reponse a la limite de la detection (TI=40). 

30 Les scrums immuns ont 6te analyses par pool pour chacun des 

groupes pour leur capacite a s6roneutraliser PinfectivitS du SRAS-CoV. 4 points de 
s6roneutralisation sur cellules FRhK-4 (100 TCID50 de SRAS-CoV) sont realises 
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pour chacune des dilutions de raison 2 testes k partir du 1/20. Le titre seroneutralisant 
est calculi selon la m&hode de Reed et Munsch comme l'inverse de la dilution 
neutralisant Pinfectivit6 de 2 cupules sur 4. Cette analyse montre que les anticorps 
induits chez la souris par les virus vaccine exprimant la proteine S ou le polypeptide 
5 Ssol sont neutralisants et que les virus & promoteurs synth&iques sont des 
immunogenes plus efficaces que les virus porteurs du promoteur 7.5K : les titres les 
plus eleves (640) sont observes apres 2 immunisations par le virus VV-TN-S (figure 
39B). 

Le pouvoir protecteur des anticorps neutralisants induits chez la 
10 souris apres immunisation par les virus vaccine recombinants est lvalue k Paide d'une 

infection d'epreuve par le SRAS-CoV. 

6) Autres applications 

Des virus vaccine recombinants de troisieme generation sont 

construits en substituant les sequences sauvages des genes S et Ssol par des genes 
15 synth&iques optimises pour Pexpression en cellules de mammifSres, decrits ci-dessus. 

Ces virus vaccine recombinants sont susceptibles d'exprimer des quantities plus 

importantes des antigenes S et Ssol et done de presenter une immunogenicite accrue. 

Le virus vaccine recombinant VV-TN-S sol peut etre utilise pour la 

production en quantite et la purification de Pantigene Ssol en vue d' applications 
20 diagnostiques (serologie par ELISA) et vaccinales (vaccin sous-unitaire). 

Exemple 17 : Virus recombinant de la rougeole exprimant la proteine de spicule 

(S) du coronavirus associe au SRAS (SRAS-CoV). Applications vaccinales. 

1) Introduction 

Le vaccin rougeole (MV) induit chez Phomme une immunity 
25 protectrice de longue duree apres une seule injection (Hilleman, 2002, Vaccine, 20 : 
651-665). La protection conferee est tres robuste et repose sur Pinduction d'une 
rgponse en anticorps et d'une r^ponse cellulaire CD4 et CD8. Le genome du MV est 
tres stable et aucune reversion vers la virulence des souches vaccinales n' a jamais et6 
observ^e. Le virus de la rougeole appartient au genre des Morbillivirus de la famille 
30 des Paramyxoviridae ; e'est un virus envelopp6 dont le genome est un ARN 
monocat^naire de polarite negative de 16kb (figure 40 A) et dont le cycle de 
replication exclusivement cytoplasmique exclut toute possibility d'int^gration dans le 
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genome de Phote. Le vaccin rougeole est ainsi Tun des vaccins vivants les plus 
efficaces et les plus surs utilises dans la population humaine. L'equipe de Fr6d6ric 
Tangy a d6velopp6 r^cemment un vecteur d' expression sur la base de la souche 
Schwarz du virus de la rougeole, qui est la sduche att&iu6e la plus sfire et la plus 
5 utilisee chez Phomme comme vaccin contre la rougeole. Cette souche vaccinale peut 
etre isolee k partir d'uh clone mol6culaire infectieux en conservant son 
immunog^nicite chez les primates ainsi que chez la souris susceptible k 1' infection. 
Elle constitue, apres insertion d'unites de transcription supplementaires, un vecteur 
pour P expression de sequences het&ologues (Combredet, 2003, J. Virol. 77 : 11546- 

10 11554). En outre, un MV Schwarz recombinant exprimant la glycoprotein 
d'enveloppe du virus West Nile (WNV) induit une reponse en anticorps efficace et de 
longue dur6e qui protege la souris d'une infection d'epreuve letale par le WNV 
(Despres et al, 2004, J. Infect. Dis., sous presse). Toutes ces caracteristiques font de la 
souche attenuee Schwarz du virus de la rougeole un candidal vecteur extremement 

15 prometteur pour la construction de nouveaux vaccins vivants recombinants. 

Le but de cet exemple est d'evaluer la capacite de virus 
recombinants de la rougeole (MV) exprimant diffSrents antigenes du coronavirus 
associe au SRAS (SRAS-CoV) a constituer de nouveaux candidats vaccins contre le 
SRAS. 

20 Les inventeurs se sont interesses a la proteine de spicule (S) du 

SRAS-CoV, qui permet d'induire apres immunisation genique chez Panimal des 
anticorps neutralisants Tinfectivite du SRAS-CoV, ainsi qu'a une forme soluble et 
s^cretee de cette proteine, le polypeptide Ssol, qui est compost de Pectodomaine (aa 
1-1 193) de la S fusionne en son extr&nite C-ter k une etiquette FLAG (DYKDDDDK) 

25 via un linker BspEl codant pour le dipeptide SG. Ce polypeptide Ssol pr^sente une 
antigenicity similaire k celle de la proteine S et permet, aprfes injection a la souris sous 
la forme d'une proteine purifiee adjuvee en hydroxide d'aluminium, Pinduction de 
titres 61ev6s d'anticorps neutralisants contre le SRAS-CoV. 

Les differentes formes du gene S ont 6t6 introduces sous la forme 

30 d'une unite de transcription supplementaire entre les genes P (phosphoprot&ne) et M 
(matrice) dans le cADN de la souche Schwarz du MV precedemment decrite 
(Combredet, 2003, J. Virol. 77 : 11546-11554 ; Demande EP N° 02291551.6 du 20 
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juin 2002, et Demande EP n° 02291550.8 du 20 juin 2002). Aprbs avoir isote les viras 
recombinants MVSchw2-SARS-S et MVSchw2-SARS-Ssol et verifie leur capacite a 
exprimer l'antigene S du SRAS-CoV, leur capacity k induire chez la souris puis chez 
le singe une rSponse immunitaire protectrice contre le SRAS est testee. 
5 2) Construction des virus recombinants 

Le plasmide pTM-MVSchw-ATU2 (figure 40B) contient un cADN 
infectieux correspondant a l'antig&iome de la souche vaccinale Schwarz du virus de la 
rougeole (MV) dans lequel une unit6 de transcription supplemental (ATU) a ete 
introduite entre les g6nes P (phosphoproteine) et M (matrice) (Combredet, 2003, 

10 Journal of Virology, 77 : 11546-11554). Des genomes recombinants MVSchw2- 
SARS-S et MVSchw2-SARS-Ssol du virus de la rougeole ont et6 construits par 
l'insertion des ORFs de la proteine S et du polypeptide Ssol au sein de l'unite de 
transcription supplementaire du vecteur MVSchw-ATU2. 

Pour cela, un fragment d'ADN contenant le cADN de la S du SRAS- 

15 CoV a et<§ amplify par PCR a l'aide des oligonucleotides 5 ' -ATACGTACGA 
CCATGTTTAT TTTCTTATTA TTTCTTACTC TCACT-3' et 5 ' - ATAGCGCGCT 
CATTATGTGT AATGTAATTT GACACCCTTG-3' en utilisant le plasmide 
pcDNA-S comme matrice puis insert dans le plasmide pCR®2.1-TOPO (Invitrogen) 
pour obtenir le plasmide pTOPO-S-MV. Les deux oligonucleotides utilises 

20 contiennent des sites de restriction BsiWl et BssHII, de fagon k permettre l'insertion 
ulterieure dans le vecteur rougeole, et ont ete confus de fa9on a generer une sequence 
de 3774 nt incluant les codons d'initiation et de terminaison, afin de respecter la rfegle 
des 6 qui stipule que la longueur du genome d'un virus rougeole doit etre divisible par 
6 (Calain & Roux, 1993, J. Virol., 67 : 4822-4830 ; Schneider et al., 1997, Virology, 

25 227 : 314-322). L'insert a 6t6 sequence a l'aide d'un kit BigDye Terminator vl.l 
(Applied Biosystems) et d'un s£quenceur automatique ABI377. 

Afin d'exprimer une forme soluble et s6cret6e de la S du SRAS- 
CoV, un plasmide contenant l'ADNc du polypeptide Ssol correspondant k 
l'ectodomaine (aa 1-1193) de la S du SRAS-CoV fusionne en son extremite C-ter a la 

30 sequence d'une Etiquette FLAG (DYKDDDDK) via un linker BspEl codant pour le 
dipeptide SG a ensuite ete obtenu. Pour cela, un fragment d'ADN a ete amplifi6 a 
l'aide des oligonucleotides 5'-CCATTTCAAC AATTTGGCCG-3 ' et 5'- 
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ATAGGATCCG CGCGCT CATT ATTTATCGTC GTCATCTTTA TAATC-3' k 
partir du plasmide pCDNA-Ssol puis ins6r6 dans le plasmide pTOPO-S-MV entre les 
sites Sail et BamHl pour obtenir le plasmide pTOPO-S-MV-SF. La sequence g6n6ree 
est longue de 3618 nt entre les sites BsiWl et BssHII et respecte la regie des 6. 
5 L' insert a €t€ sequence comme indique ci-dessus. 

Les fragments BsiWl -BssHII contenant les ADNc de la proline S 
et du polypeptide Ssol ont ensuite £te excises par digestion des plasmides pTOPO-S- 
MV et pTOPO-S-MV-SF puis sous-clones entre les sites correspondants du plasmide 
pTM-MVSchw-ATU2 pour donner les plasmides pTM-MVSchw2-SARS-S et pTM- 

10 MVSchw2-SARS-Ssol (figure 40B). Ces deux plasmides ont 6t6 deposes k la 
C.N.C.M. le l er decembre 2004, sous les numeros 1-3326 et 1-3327, respectivement 

Les virus rougeole recombinants correspondants aux plasmides 
pTM-MVSchw2-SARS-S et pTM-MVSchw2-SARS-Ssol ont 6t6 obtenus par 
gen^tique inverse selon le syst&me reposant sur ^utilisation d'une lign6e cellulaire 

15 auxiliaire, d^crit par Radecke et coll. (1995, Embo J., 14, : 5773-5784) et modifie par 
Parks et coll. (1999, J. Virol., 73 : 3560-3566). Bridvement, les cellules auxiliaires 
293-3-46 sont transferees selon la methode au phosphate de calcium par 5 jug des 
plasmides pTM-MVSchw2-SARS-S ou pTM-MVSchw2-SARS-Ssol et 0,02 \xg du 
plasmide pEMC-La dirigeant l'expression de la polymerase L du MV (don de M.A. 

20 Billeter). Apres une nuit d'incubation a 37°C, un choc thermique est realist pendant 2 
heures k 43 °C et les cellules transferees sont transferees sur une monocouche de 
cellules Vero. Pour chacun des deux plasmides, des syncytia sont apparus apres 2 a 3 
jours de co-culture et ont 6t6 transferes successivement sur des monocouches de 
cellules Vero k 70% de confluence en boites de p6tri de 35 mm puis en flacons de 25 

25 et 75 cm 2 . Quand les syncytia ont atteint 80-90% de confluence, les cellules sont 
r6cup6rees k 1'aide d'un grattoir puis congetees et d6congel6es une fois. Apr&s une 
centrifugation a basse vitesse, le surnageant contenant le virus est conserve en aliquot 
a -80°C. Les titres des virus recombinants MVSchw2-SARS-S et MVSchw2-SARS- 
Ssol ont 6t6 d6termin6s par dilution limite sur cellules Vero et le titre en dose infectant 

30 50% des cupules (TCID50) calculi selon la methode de KSrber. 
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3) Caracterisation des virus recombinants 

L'expression des transg&nes codant la proline S et le polypeptide 
Ssol a 6t6 recherchSe par western blot et immunofluorescence. 

Des monocouches de cellules Vero en flacons T-25 ont ete infectees 
5 k une multiplicity de 0,05 par differents passages des deux virus MVSchw2-SARS-S 
et MVSchw2-SARS-Ssol et le virus sauvage MWSchw a titre de controle. Quand les 
syncytia ont atteint 80 k 90% de confluence, des extraits cytoplasmiques ont ete 
prepares dans un tampon d'extraction (150mMNaCl, 50 mM Tris-HCl pH 7,2, 1% 
triton-X-100, 0,1% SDS, 1% DOC) puis dilues en tampon de d<§pot selon Laemmli, 
10 s6pares sur un gel SDS a 8% de polyacrylamide et transf6r6s sur une membrane de 
PVDF (BioRad). La detection de cette immunoempreinte (« western blot») a 6\€ 
r^alisee k l'aide d'un s6rum polyclonal de lapin anti-S (immun-serum du lapin 
PI 1135 : cf exemple 4 ci-dessus) et d'anticorps polyclonaux d'ane dirig<§s contre les 
IgG de lapin et couples k la peroxidase (NA934V, Amersham). Les anticorps fixes ont 
15 et6 r6v61es par luminescence k Taide du kit ECL+ (Amersham) et de films 
d'autoradiographie Hyperfilm MP (Amersham). 

Des cellules Vero en monocouches sur lamelles de verre ont ete 
infectees par les deux virus MVSchw2-SARS-S et MVSchw2-SARS-Ssol et le virus 
sauvage MWSchw a titre de controle k des multiplicity d'infection de 0,05. Quand les 
20 syncytia ont atteint 90 a 100% (virus MVSchw2-SARS-Ssol) ou 30 a 40% 
(MVSchw2-SARS-S,MWSchw) de confluence, les cellules ont &e fixees dans une 
solution de PBS-PFA 4%, permeabilis^es par une solution de PBS contenant 0,2% de 
triton puis marquees par des anticorps polyclonaux de lapins hyperimmunises par des 
virions purifies et inactives du SRAS-CoV et par un conjugue d' anticorps de chevre 
25 anti-IgG(H+L) de lapin couple au FITC (Jackson). 

Comme le montrent les figures 41 et 42, les virus recombinants 
MVSchw2-SARS-S et MVSchw2-SARS-Ssol diligent l'expression de la proline S et 
du polypeptide Ssol respectivement a des niveaux comparables a ceux que Ton peut 
observer 8h apr^s infection par le SRAS-CoV. L'expression de ces polypeptides est 
30 stable apres 3 passages des virus recombinants en culture cellulaire. Ces r^sultats 
demontrent que les virus rougeole recombinants sont bien porteurs des transgenes et 
permettent l'expression de la glycoprotdine du SRAS sous sa forme membranaire (S) 
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ou sous une forme soluble (Ssol). On s' attend k ce que le polypeptide Ssol soit secrete 
des cellules infectives par le virus MVSchw2-SARS-Ssol comme c'est le cas lorsque 
ce meme polypeptide est exprime dans des cellules de mammiffcres apres transfection 
transitoire des sequences correspondantes (cf exemple 1 1 ci-dessus). 
5 4) Applications 

Ayant montn§ que les virus MVSchw2-SARS-S et MVSchw2- 
SARS-Ssol permettent l'expression de la S du SRAS-CoV, leur capacite k induire une 
reponse immunitaire protectrice contre le SRAS-CoV chez la souris CD46 +/ " IFN- 
apR 7 ', qui est susceptible a l'infection par le MV, est 6valu6e. La reponse en anticorps 

10 des souris immunises est evaluee par test ELISA contre les antigenes natifs du 
SRAS-CoV et pour leur capacity k neutraliser l'infectivit£ du SRAS-CoV in vitro, en 
utilisant les methodologies decrites ci-dessus. Le pouvoir protecteur de la reponse sera 
evalu£ en mesurant la reduction de la charge virale pulmonaire 2 jours apres une 
infection d'epreuve non l£tale par le SRAS-CoV. 

15 Des virus rougeole recombinants de seconde generation sont 

construits en substituant les sequences sauvages des genes S et Sol par des genes 
synth&iques optimises pour Y expression en cellules de mammiferes, decrits a 
l'exemple 15 ci-dessus. Ces virus rougeole recombinants sont susceptibles d'exprimer 
des quantit6s plus importantes des antigenes S et Ssol et done de presenter une 

20 immunogenicite accrue. 

Alternativement, les genes sauvages ou synth&iques codant pour la 
proline S ou le polypeptide Ssol peuvent §tre inserts dans le vecteur rougeole 
MVSchw-ATU3 sous la forme d'une unite de transcription supplemental localisee 
entre les genes H et L, puis les virus recombinants produits et caract£rises de fa9on 

25 similaire. Cette insertion est susceptible de g£n6rer des virus recombinants poss£dant 
des caracteristiques (multiplication du virus, niveau d' expression du transgfcne) 
differentes et possiblement une immunogenicite amelioree par rapport k ceux obtenus 
aprds insertion des transgdnes entre les genes P et N, 

Le virus rougeole recombinant MVSchw2-SARS-Ssol peut etre 

30 utilise pour la production en quantity et la purification de l'antigene Ssol en vue 
d' applications diagnostiques et vaccinales. 
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Exemple 18 : Autres applications liees h la proteine S 

a) Les vecteurs lentiviraux permettant l'expression de la S ou de Ssol 
(voire de fragments de la S) peuvent constituer un vaccin recombinant contre le 
SRAS-CoV, pour etre utilise en prophylaxie humaine et v6t6rinaire. Afin de 

5 demontrer la faisabilit6 d f un tel vaccin, rimmunog6nicit6 des vecteurs lentiviraux 
recombinants TRIP-SD/SA-S-WPRE et TRIP-SD/SA-Ssol-WPRE est etudtee chez la 
souris. 

b) Des anticorps monoclonaux sont produits k Taide du polypeptide 
recombinant Ssol. D'aprSs les r6sultats presentes a l'exemple 14 ci-dessus 3 ces 

10 anticorps ou du moins la majorite d'entre eux reconnaitront la forme native de la S du 
SRAS-CoV et seront susceptibles d' applications diagnostiques et/ou prophylactiques. 

c) Un test de serologie du SRAS est mis au point avec le polypeptide 
Ssol utilise comme antigene et la methodologie du double epitope. 
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REVENDICATIONS 

1°) Prot&ne ou polypeptide isote et purifie, caract6ris6 en ce qu'il 
s'agit de la proline S de sequence SEQ ID NO :3, de son ectodomaine, ou d'un 
5 fragment de son ectodomaine. 

2°) Prot&ne ou polypeptide selon la revendication 1, caracterise en 
ce qu f il est constitue des acides amines correspondant aux positions 1 a 1 193 de la 
sequence en acides amines de la proteine S. 

3°) Proline ou polypeptide selon la revendication 1, caract6ris6 en 
10 ce qu'il est constitu6 des acides amines correspondant aux positions 14 k 1193 de la 
sequence en acides amines de la proline S. 

4°) Proteine ou polypeptide isol6 selon la revendication 1, 
caracterise en ce qu'il est constitu6 des acides amines correspondant aux positions 475 
a 1 193 de la sequence en acides amin6s de la proteine S. 
15 5°) Acide nucleique codant pour une proline ou un polypeptide 

selon Tune quelconque des revendications 1 a 4. 

6°) Acide nucleique selon la revendication 4, caracteris6 en ce qu'il 
comprend la sequence codante SEQ ID NO: 5 ou la sequence codante SEQ ID NO:6. 

7°) Vecteur ^expression recombinant, caracterise en ce qu f il code 
20 pour une proteine ou un polypeptide selon l'une quelconque des revendications 1 a 4. 

8°) Vecteur d' expression recombinant selon la revendication 7, 
caracterise en ce qu'il est choisi parmi les vecteurs contenus dans les souches 
bacteriennes suivantes, d6pos6es aupres de la Collection Nationale de Cultures de 
Microorganismes (CNCM), 25 rue du Docteur Roux, 75724 Paris Cedex 15 : 
25 a) souchen°I-3118, d^posee le 23 octobre 2003, 

b) souche n° I- 3019, d6pos<§e le 12 mai 2003, 

c) souche n° I- 3020, depos^e le 12 mai 2003, 

d) souche n°I-3059, d6pos6e le 20 juin 2003, 

e) souche n° 1-3323, d6pos£e le 22 novembre 2004, 
30 f) souche n° 1-3324, d6pos6e le 22 novembre 2004, 

g) souche n° 1-3326, depos^e le l er d6cembre 2004, 

h) souche n° 1-3327, d6pos6e le l er ddcembre 2004, 
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i) souche n° 1-3332, deposSe le l er decembre 2004, 
j) souche n° 1-3333, d6pos6e le l er dScembre 2004 
k) souche n° 1-3334, deposee le l er decembre 2004, 
1) souche n° 1-3335, d<§pos<§e le l er decembre 2004, 
5 m) souche n° 1-3336, deposge le l er decembre 2004, 

n) souche n° 1-3337, d6pos6e le l er decembre 2004, 
o) souche n° 1-3338, deposee le 2 decembre 2004, 
p) souche n° 1-3339, depos&s le 2 decembre 2004, 
q) souche n° 1-3340, deposee le 2 decembre 2004, et 
1 0 r) souche n° 1-3341 , deposee le 2 decembre 2004. 

9°) Acide nucleique comportant un gene synth&ique permettant une 
expression optimise de la proline S dans des cellules eucaryotes, caract&is6 en ce 
qu'il possSde la sequence SEQ ID NO: 140 

10°) Vecteur d'expression comportant un acide nucl&que selon la 
15 revendication 9, caractdris6 en ce qu'il est contenu dans la souche bacterienne deposee 
k la CNCM, le l er decembre 2004, sous le n°I-3333. 

11°) Vecteur d'expression selon la revendication 7 ou la 
revendication 9, caracterise en ce qu ! il s f agit d'un vecteur viral, sous forme de particule 
virale ou sous forme de genome recombinant. 
20 12°) Vecteur selon la revendication 1 1, caract&is6 en ce qu'il s'agit 

d'une particule virale recombinante ou d'un genome viral recombinant susceptible 
d'etre obtenu par transfection d'un plasmide selon les alin^as g), h) ou k) a r) de la 
revendication 8, dans un systeme cellulaire approprte. 

13°) Vecteur lentiviral codant pour un polypeptide selon 1'une 
25 quelconque des revendications 1 k 4. 

14°) Virus rougeole recombinant codant pour un polypeptide selon 
1'une quelconque des revendications 1 & 4. 

15°) Virus vaccine recombinant codant pour un polypeptide selon 
Tune quelconque des revendications 1 & 4. 
30 16°) Utilisation d'un vecteur selon les alin£as d) k p) de la 

revendication 8, ou d'un vecteur selon la revendication 10, pour la production, en 
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systeme eucaryote, de la proline S du coronavirus associe au SRAS, ou d'un fragment 
de cette proline. 

17°) Methode de production de la proline S en systeme eucaryote, 
comportant une etape de transfection de cellules eucaryotes en culture par un vecteur 
5 choisi parmi les vecteurs contenus dans les souches bacteriennes mentionnees aux 
alin6as d) a p) de la revendication 8, ou k la revendication 10. 

18°) Cellule eucaryote g6netiquement modifi6e exprimant une 
proline ou un polypeptide selon Tune quelconque des revendications 1 a 4. 

19°) Cellule selon la revendication 18, susceptible d'etre obtenue par 
10 transfection par Tun quelconque des vecteurs mentionnes aux alin^as k) a n) de la 
revendication 8. 

20°) Cellule selon la revendication 19, caract&isee en ce qu f il s f agit 
de la cellule FRhK4-Ssol-30, deposee k la CNCM le 22 novembre 2004, sous le n°I- 
3325. 

15 21°) Anticorps monoclonaux reconnaissant la proline S native d'un 

coronavirus associe au SRAS. 

22°) Utilisation d'une proteine ou d'un polypeptide selon Tune 
quelconque des revendications 1 a 4, ou d'un anticorps selon la revendication 21, pour 
detecter une infection par un coronavirus associe au SRAS, a partir d'un echantillon 

20 biologique. 

23°) Methode de detection d'un coronavirus associe au SRAS, a 
partir d'un echantillon biologique, caracterisee en ce que la detection est effectuee par 
ELISA utilisant la proline S recombinante ou son ectodomaine, ou un fragment de 
son ectodomaine, exprim^e dans un systdme eucaryote. 

25 24°) M£thode de detection selon la revendication 23, comportant en 

outre une etape de detection par ELISA utilisant la proline N recombinante, 

25°) Methode selon la revendication 23 ou 24, caracterisee en ce qu'il 
s'agit d'une methode par ELISA double epitope, et en ce que le serum k tester est 
melange a l'antig&ne de revelation, ledit melange etant ensuite mis au contact de 

30 l'antigene fixe sur un support solide. 
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26°) Complexe immun forme d'un anticorps ou d'un fragment 
d'anticorps monoclonal selon la revendication 21, et d f une protdine ou d'un peptide du 
coronavirus associ6 au SRAS. 

27°) Complexe immun form6 d'une proline ou d'un polypeptide 
5 selon Tune quelconque des revendications 1 a 4, et d'un anticorps dirigg 
specifiquement contre un epitope du coronavirus assocte au SRAS. 

28°) Kit ou coffret de detection d'un coronavirus associe au SRAS, 
caract&ise en ce qu'il comprend au moins un rSactif selection^ dans le groupe 
constitue par : une proline ou polypeptide selon Tune quelconque des revendications 
10 1 a 4, un acide nucleique selon Tune quelconque des revendications 5, ou 6, une 
cellule selon Tune quelconque des revendications 18 a 20, ou un anticorps selon la 
revendication 21. 

29°) Composition immunog6ne et/ou vaccinale, caracterisee en ce 
qu'elle comprend un polypeptide ou une proline recombinante selon Time quelconque 
15 des revendications 1 a 4, obtenu dans un syst&ne d'expression eucaryote. 

30°) Composition immunogene et/ou vaccinale, caract6ris£e en ce 
qu'elle comprend un vecteur ou virus recombinant selon Tune quelconque des 
revendications 7, 8, et 10 a 15. 

31°) InsSrat d'acide nucl6ique d'origine virale, caracterisS en ce 
20 qu'il est contenu dans Tune quelconque des souches mentionnees aux alineas a) a h) et 
k) a r) de la revendication 8. 
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TTTTACTGTC GTTGACAAGA AACGAGTAAC TCGTCCCTCT TCTGCAGACT GCTTACGGTT TCGTCCGTGT 



150 



160 



170 



180 



190 



200 



210 



X TthHB8 I 
>< TaqI 
X Sau3AI 
X Ndell 
>< Mbol 
>< DpnII 

x Dpnl 
>< BspAI 

X Bspl43I 



>< Styl 

>< Rmal X ScrFI 

>< Mael >< Neil 

X EcoT14I X Mspl 

>< Ecol30I >< Maelll 

X BssTlI X Hpall 

x BsaJI x HapII 

x Blnl x DsaV 

>< Avrll x Bcnl 

TGCAGTCGAT CATCAGCATA CCTAGGTTTC GTCCGGGTGT GACCGAAAGG TAAGATGGAG AGCCTTGTTC 

220 230 240 250 260 270 280 



X Rmal 
X Esp3I X Maell 
X Hindll x MaeII> < Eco57I >< BsmAI X Mael 

x Hindi > < AflHI > < Ddel X Alw26I x BsmBI 

TTGGTGTCAA CGAGAAAACA CACGTCCAAC TCAGTTTGCC TGTCCTTCAG GTTAGAGACG TGCTAGTGCG 
290 300 310 320 330 340 350 
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>< Sau96I 

>< PssI 
>< Pall 
>< NspIV 
>< Mnll 
>< Haelll 
X EcoO109I 

>< DrallX MboII >< Pmll 
>< Cfrl3I >< PmaCI 

>< BsuRI > < Maell 

>< BsiZlx EcoNI >< Eco72I 
X BshI X BslI >< BsaAI 
>< Plel >< Eamll04I>< Asul x BsiYIX BbrPI >< Mnll 

TGGCTTCGGG GACTCTGTGG AAGAGGCCCT ATCGGAGGCA CGTGAACACC TCAAAAATGG CACTTGTGGT 
360 370 380 390 400 410 420 



X 



X Mnll 
>< Ksp632I 
Hinf I 
>< Earl 



x Tru9I 

x Rsal >< SfaNI 

X Rmal X Csp6I X BspWI X Msel 

x Mael X Alul X Afal >< Alul > < Maell 

CTAGTAGAGC TGGAAAAAGG CGTACTGCCC CAGCTTGAAC AGCCCTATGT GTTCATTAAA CGTTCTGATG 
430 440 450 460 470 480 490 



X Tru9I 
X Msel 
X Esp4I 
>< Aflll 



X PaLI 
X Haelll 

x Gdill 

>< Eael 
X BsuRI 
X BshI 



>< Rsal 
Mcrl X 
x Csp6I 
X BsmI BsiEI X 



>< Alul 



X BscCI 



X Afal 



CCTTAAGCAC CAATCACGGC CACAAGGTCG TTGAGCTGGT TGCAGAAATG GACGGCATTC AGTACGGTCG 
500 510 520 530 540 550 560 



X Nspl 
X NspHI 
>< Nlalll 

>< BslI >< MboII 

X BsiYI >< MboII 

X Acil X Afal X AflHI >< Muni X Acil 

TAGCGGTATA AC ACT GGG AG TACTCGTGCC ACATGTGGGC GAAACCCCAA TTGCATACCG CAATGTTCTT 
570 580 590 600 610 620 630 



X Seal 
X Rsal 
> < Csp6I 
x BsrI 

X Afal 



x NIalV 
X Mspl 

X Hpall >< 

X HapII >< 

x CfrlOI >< 

>< BscBI >< Alul >< 
CTTCGTAAGA ACGGTAATAA GGGAGCCGGT GGTCATAGCT ATGGCATCGA TCTAAAGTCT TATGACTTAG 

64 0 650 660 670 68 0 690 7 00 



X TthHB8 I 
X TaqI 

X Sau3AI 

X Ndell 

X Mbol 

X DpnII 

> < Dpnl 
X Clal 

>< BsulSI 
X BspDI 
>< BspAI 

> < Bspl43I 
Bspl06I 
BsiXI 

Bscix SfaNI 
Banlll 



Maelll 
Ddel >< 
Bfrl X 
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>< Sau3AI 
>< Ndell 
>< Mbol 
X HphI 

>< DpnII 
>< BspAI 
>< AlwlX Dpnl 
>< Alul >< Bspl43I 



>< Mbol I >< 



>< 
BsrI 



Ddel 



Vnel >< 
Snol >< 
> < Nlalll 
ApaLI >< 
Alw4 4I >< 



GTGACGAGCT TGGCACTGAT CCCATTGAAG ATTATGAACA AAACTGGAAC ACTAAGCATG GCAGTGGTGC 



710 



720 



730 



740 



750 



760 



770 



>< Sdul 
>< NspII 
>< HgiAI 

>< Dralll 
>< Bspl286I 
>< Bmyl 
>< Alw21I 



>< SstI 
>< Sdul 
>< SacI 
>< NspII 

>< Mnll 
>< HgiAI 
>< Eco24I 

>< Ecll36II 
>< Bspl286I 
>< Bmyl 
>< Banll 
>< Alw21I 

>< Alul 



>< Maelll 



>< TthHB8I 
>< TaqI 

< Sail 

< Rtrl 

>< Hindll 
>< Hindi 
>< Bsgl 
>< AccI 



Sau96I >< 
Pall >< 
NspIV >< 
Haelll >< 
Cfrl3I >< 
BsuRI >< 
BsiZI >< 
BshI >< 
Asul >< 



ACTCCGTGAA CTCACTCGTG AGCTCAATGG AGGTGCAGTC ACTCGCTATG TCGACAACAA TTTCTGTGGC 



780 



790 



800 



810 



820 



830 



840 



>< Thai 
>< Thai 

x Mvnl 
X Mvnl 

> < Rsal >< HinPlI 

> < NlalV >< Hin6I 

x Kpnl >< Hhal 

X Eco64I >< Cfol 

X Csp6I >< BstUI 

> < BscBI >< BstUI 
>< BanI >< Bsp50I 
X Asp718 >< Bsp50I 

> < Afal >< Acil 
X AccBlI X AccII 
x Acc65I >< Mnll x SfaNI >< AccII 

CCAGATGGGT ACCCTCTTGA TTGCATCAAA GATTTTCTCG CACGCGCGGG CAAGTCAATG TGCACTCTTT 
850 860 870 880 890 900 910 



> < Vnel 

> < Snol 

X Sdul 
NspII >< 
HgiAI X 
Bspl286I >< 

X Bmyl 

> < ApaLI 

> < Alw4 4I 
Alw21I X 



X 



X 



CCGAACAACT T GATT AC AT C 
920 930 



X TthHB8 I 
TthHB8I 

X TaqI 
TaqI 

>< Mnll 

>< Ksp632I Nlalll X 

X HinfIX Plel >< Nlalll 

x Eamll04I >< MboII x Maelll EcoRII x 

>< Earl > < BbvIX AccI X Fnu4HI DsaV X 

GAGTCGAAGA GAGGTGTCTA CTGCTGCCGT GACCATGAGC ATGAAATTGC 
940 950 960 970 980 



X ScrFI 



>< HinPlI 



X TthHB8 I 

>< TaqI 

X Sful 

X NspVX Tru9I 

x Lsplx Msel 
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>< Mval >< Hin6I >< Sdul >< Csp45I 

>< EcL136I >< Hhal >< NspII >< BstBI 

>< BstOI >< Haell >< HgiAI >< Bspll9I 

>< BstNI >< Eco47III >< Bspl286I >< BsiCI 

>< BsiLI >< Cfol >< Bmyl >< Bpul4I 

>< Apyl >< Ddel >< Bspl43II >< Alul >< Alw21I >< AsuII 

CTGGTTCACT GAGCGCTCTG ATAAGAGCTA CGAGCACCAG ACACCCTTCG AAATTAAGAG TGCCAAGAAA 

990 1000 1010 1020 1030 1040 1050 

>< Tru9I 
>< BsmI >< Msel 

>< BscCI > < Mnll 

TTTGACACTT TCAAAGGGGA ATGCCCAAAG TTTGTGTTTC CTCTTAACTC AAAAGTCAAA GTCATTCAAC 
1060 1070 1080 1090 1100 1110 1120 

>< Pmll 
>< PmaCI 
>< Maell 
>< Eco72I 

>< BsaAI >< Nlalll >< Rsal 

>< BbrPI >< Bstll07I >< Csp6I 

>< Afllll >< Mnlix Ddel >< AccI x Afal 

CACGTGTTGA AAAGAAAAAG ACTGAGGGTT TCATGGGGCG TATACGCTCT GTGTACCCTG TTGCATCTCC 
1130 1140 1150 1160 1170 1180 1190 

x SfaNI 

X Maelll x AccI Nlalll X 

AC AGG AG T G T AACAATATGC ACTTGTCTAC CTTGATGAAA TGTAATCATT GCGATGAAGT TTCATGGCAG 

1200 1210 1220 1230 1240 1250 1260 

X SinI 
X Sau96I 
PssI X 

x PspSII 
X PpuMI 
>< NspIV 

X NspHII 
X Eco47I 
X Drall 
>< Cfrl3I 
X BsiZI 
X Brael8I 
X Avail 
X Asul 

X Maell EcoO109I XAflHI > 

ACGTGCGACT TTCTGAAAGC CACTTGTGAA CATTGTGGCA CTGAAAATTT AGTTATTGAA GG ACC TACT A 
1270 1280 1290 1300 1310 1320 1330 

Van91I >< 

SinI >< 

>< Rsal Sau96I X 

x Nspl PflMI X 

>< NlalV NspIV X 

X Nlalll NspHII > 

X NspHIX Kpnl Eco47I x 

X Eco64I Cfrl3I X 

X Csp6I BslI X 

>< BscBI BsiZI X 

X BanI BsiYI >< 

>< Asp718 Bmel8I X 

x Afal Avail >< 

X AccBlI Asul X 
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>< Acc65I >< Sfcl >< Nlalll AccB7I X 

CATGTGGGTA CCTACCTACT AATGCTGTAG TGAAAATGCC ATGTCCTGCC TGTCAAGACC CAGAGATTGG 
1340 1350 1360 1370 1380 1390 1400 

>< TthHB8 I 
>< TaqlX Mnll 
>< Hinfl 

>< Ddel >< Plel >< Acil 

ACCTGAGCAT AGTGTTGCAG ATTATCACAA CCACTCAAAC ATTGAAACTC GACTCCGCAA GGGAGGTAGG 
1410 1420 1430 1440 1450 1460 1470 

>< Rmal NlalV >< 

>< Mnll >< Bsrl 

>< Mael >< Bbvl >< Fnu4HI BscBI >< 

ACTAGATGTT TTGGAGGCTG TGTGTTTGCC TATGTTGGCT GCTATAATAA GCGTGCCTAC TGGGTTCCTC 

1480 1490 1500 1510 1520 1530 1540 



>< Mael I r 
>< Pall >< Eco31I 

>< Haelll >< Bsrl >< 

>< Rmal >< BsuRI >< Bsrl >< BsmAI 

>< Mnll > < Ddel >< BspWI >< Bsaix HphI 

X Mael X BshlX Bgll X Alw26I 

GTGCTAGTGC TGATATTGGC TCAGGCCATA CTGGCATTAC TGGTGACAAT GTGGAGACCT TGAATGAGGA 
1550 1560 1570 1580 1590 1600 1610 



XhoII 
Sau3AI 
Ndell 
Mfll 
Mbol 
DpnII 
Mnll Dpnl > 
BstYI >< 
BspAl X 
Bspl43I > 



X 
X 
X 
X 
X 
X 



X Alwl 



> < Tru9I 

> < Mset 

X Maell X Tru9I 
x Hpal 
X Hindll 
>< Hinfl x Plel >< Hindi 
x Ddel x Afllir x Msel 



< Mnll 

< Ksp632I 

< Earl 

< Eamll04I 



TCTCCTTGAG ATACTGAGTC GTGAACGTGT TAACATTAAC ATTGTTGGCG ATTTTCATTT GAATGAAGAG 

1620 1630 1640 1650 1660 1670 1680 

X MboII Plel >< 

X BstXI x SfaNI > < Hinfl 

GTTGCCATCA TTTTGGCATC TTTCTCTGCT TCTACAAGTG CCTTTATTGA CACTATAAAG AGTCTTGATT 

1690 1700 1710 1720 1730 1740 1750 



>< Plel 
x Maelll 
X HinflX Acil 



x Styl 
x Maelll 

X EcoT14I 
>< Ecol30I 
X BssTlI 
X BsaJI 



BslI X 
BsiYI X 



ACAAGTCTTT CAAAACCATT GTTGAGTCCT GCGGTAACTA TAAAGTTACC AAGGGAAAGC CCGTAAAAGG 



1760 



1770 



1780 



1790 



1800 



1810 



1820 



X Sau3AI 
X Ndell 
>< Mbol 
X Dpnri 

X Dpnl X Tru9I 
>< BspAI >< MseT 

X Bspl43I 



>< Van91I 

x PflMI 

X Dralll 

>< BslI 

X BsiYI 

X Bbvl 

X AccB7I 



X Mnll 
Enu4HI X 
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TGCTTGGAAC ATTGGACAAC AGAGATCAGT TTTAACACCA CTGTGTGGTT TTCCCTCACA GGCTGCTGGT 



1830 



1840 



1850 



1860 



1870 



1880 



1890 



>< 



>< 



>< Thai 
>< SfaNI 
>< Mvtil 
X HinPlI 
HinPlI 
X Hin6I 
Hin6I 

x Hhal 
>< Hhal 

x Cfol PvuII > 

>< Cfol Psp5I > 

X BstUI NspBII > 

BssHII HphI X 

X BspSOI Fnu4HI X 

X AccII >< Fnu4HI X Bbvl Alul > 

GTTATCAGAT CAATTTTTGC GCGCACACTT GATGCAGCAA ACCACTCAAT TCCTGATTTG CAAAGAGCAG 
1900 1910 1920 1930 1940 1950 1960 



X Sau3AI 
>< Ndell 
X Mbol 
X DpnII 

>< Dpnl 
X BspAI 

X Bspl43I 



X 



X TthHB8 I 

>< Styl 
X Ncol 
X Hindi! 
X Hindi 
x Hinll 

X EcoT14I 
X Eco57I 
>< TaqlX Ecol30I 
>< Sail x Dsal 
>< Rtrl X BssTlI 
>< BsaHI 

>< Bbillx NlaHI 
>< Maelll >< AcyI >< HgaI 

x Bbvl >< Maell x Acclx BsaJI HphI x 

CTGTCACCAT ACTTGATGGT ATTTCTGAAC AGTCATTACG TCTTGTCGAC GCCATGGTTT ATACTTCAGA 
1970 1980 1990 2000 2010 2020 2030 



>< Rsal 
> < Csp6I 



x Ndel 

X BspMI >< Maelll x BsrI X Afal X Ddel 

CCTGCTCACC AACAGTGTCA TTATTATGGC ATATGTAACT GGTGGTCTTG T AC AACAG AC TTCTCAGTGG 



2040 



2050 



2060 



2070 



2080 



2090 



2100 



X Sdul 
>< NspII 
X Bspl286I 
X Bmyl 



x 



X 
X 
X 
X 

Ddel 

x 

X 
X 



Stul 
Pall 
Haelll 
Ecol47I 

BsuRI 
BshI 
AatI 



> < Mnll 



Ddel 
Bfrl 



>< 

X 



TTGTCTAATC TTTTGGGCAC TACTGTTGAA AAACTCAGGC CTATCTTTGA ATGGATTGAG GCGAAACTTA 
2110 2120 2130 2140 2150 2160 2170 



X Tfil 

X Hinfl Tthllll X 

X SfaNI x Bsgl >< Fokl Aspl >< 

GTGCAGGAGT TGAATTTCTC AAGGATGCTT GGGAGATTCT CAAATTTCTC ATTACAGGTG TTTTTGACAT 
2180 2190 2200 2210 2220 2230 2240 



FIGURE 13.6 



WO 2005/056781 



PCT/FR2004/003105 



20/116 



Tru9I X 
Msel >< 
Hpal > 
Hindi I > 

>< Eco57I Hindi > 

CGTCAAGGGT CAAATACAGG TTGCTTCAGA TAACATCAAG GATTGTGTAA AATGCTTCAT TGATGTTGTT 



2250 



2260 



2270 



2280 



2290 



2300 



2310 



>< Sau3AI 
>< Ndell 
>< Mbol 

> < Maelll 

>< Fbal 
>< DpnII 

>< Dpnl 

>< BspAI >< HinPlI 

>< Bspl43I >< Hin6I 

>< TthHB8I >< BsiQI >< Hhal 

>< TaqI >< Bcil X Cfol 

AACAAGGCAC TCGAAATGTG CATTGATCAA GTCACTATCG CTGGCGCAAA GTTGCGATCA CTCAACTTAG 
2320 2330 2340 2350 2360 2370 2380 



>< Sau3AI 
>< Ndell 
>< DpnII 

>< DpnIMboII 
Ddel >< 
>< Bspl43I 
>< MboIBfrl >< 
>< BspAI Bbsl 



>< 



>< 



>< HphI 



>< DrdI 



>< Maell 
>< Bstll07I 
>< BsaAI 
>< Bbvl 
>< AccI 



>< PvuII 
>< PspSI 
>< NspBII 
Fnu4HI X 

> < Fnu4HI 
>< Alul 



GTGAAGTCTT CATCGCTCAA AGCAAGGGAC TTTACCGTCA GTGTATACGT GGCAAGGAGC AGCTGCAACT 
2390 2400 2410 2420 2430 2440 2450 



>< Tru9I 

>< NlalV 
>< Msel 

>< Mnll 

>< Esp4I >< Seal 

>< Eco64I >< Rsal 

>< BscBI >< NlaHIMnil >< 

>< Nlalll >< BanI Mnil >< 

X Aflll X Tfil X Csp6I 

>< Bbvl >< AccBlI X Maelll X Hinfl X HphI X Afal 
ACTCATGCCT CTTAAGGCAC CAAAAGAAGT AACCTTTCTT GAAGGTGATT CACATGACAC AGTACTTACC 

2460 2470 2480 2490 2500 2510 2520 



> < Xhol 
>< TthHB8I 

X TthHB8 I X TaqI 

> < Slal 

> < PaeR7I 

> < Nsp-III 
X HphI >< Hinll 

> < Eco88I 

> < Ccrl 
>< Esp3I >< BsaHI 

> < Bcol 
X BsmAI X Bbill 

> < Aval >< Hgal 
X TaqI > < Araa87I>< BsmBI 

X Alw26I X Acyl >< Alul 

TCTGAGGAGG TTGTTCTCAA GAACGGTGAA CTCGAAGCAC TCGAGACGCC CGTTGATAGC TTCACAAATG 
2530 2540 2550 2560 2570 2580 2590 



>< Ddeix Mnll 
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>< Alul 



>< BsrI 



>< 
>< 
>< 
>< 



Pall >< 
Haelll 
BsuRI 
BshI 



Nlalll 

X Mnll 
>< Ddel 
X Bfrl 



X Tru9I 
X Msel 



GAGCTATCGT TGGCACACCA GTCTGTGTAA ATGGCCTCAT GCTCTTAGAG ATTAAGGACA AAGAACAATA 



2600 



2610 



2620 



2630 



2640 



2650 



2660 



>< ScrFI 
>< Mval 
>< EcoRII 
>< MstI >< Ecll36I 

>< HinPlI >< DsaV 
>< Hin6I >< BstOI 

x Hhal >< BstNI 
>< Fspl x BsmAI 

>< Fdill x BslLI 

>< Cfol X Apyl 
X Avill X Alw26I X BsrI 
CTGCGCATTG TCTCCTGGTT TACTGGCTAC AAACAATGTC 
2670 2680 2690 2700 



>< Vnel 

Tru9I X 
>< Snol 

x Sdul 
x NspII 
Msel x 
x HgiAI 
Bspl286I XBslI >< 
BsiYI >< 
>< Bmyl 
x ApaLI 
X Tru9I >< Alw44I 
X Msel >< Alw21X 

TTTCGCTTAA AAGGGGGTGC ACCAATTAAA 
2710 2720 2730 



>< Tfil 

>< Maelll X MboII > < Maelir >< Hinfl Alul X 

GGTGTAACCT TTGGAGAAGA TACTGTTTGG GAAGTTCAAG GTTACAAGAA TGTGAGAATC ACATTTGAGC 



2740 



2750 



2760 



2770 



2780 



2790 



2800 



>< Maell 

x 

X 

X Afllll 



Hindll 
Hindi 



x Tru9I 
x Msel 



>< Sdul 
>< NspII 
x HgiAI 
X Bspl286I 
x Bmyl 
X Alw21I 

X Accl 



>< 



X 



x Rsal 
>< NlalV 
Maelll x 
>< Mspix Kpnl 
>< Hpall 
>< HapII 

> < Eco64I 
>< Csp6l 

Tfil >< BscBI 

> < BanI 

> < Asp718 
Hinfl >< Afal 



AccBlI 
Acc65I 



TTGATGAACG TGTTGACAAA GTGCTTAATG AAAAGTGCTC TGTCTACACT GTTGAATCCG GTACCGAAGT 
2810 2820 2830 2840 2850 2860 2870 

>< Sau3AI 
>< NdeH 
x Mbol 
>< DpnH 

X Nspl > < Dpnl 

>< NspHI >< MboII X BspAI 

X Nlallt > < BsrI > < Bspl43I 

>< Odel >< Mnll >< AlwNI x Bbsl x AlwNI 

TACTGAGTTT GCATGTGTTG TAGCAGAGGC TGTTGTGAAG ACTTTACAAC CAGTTTCTGA TCTCCTTACC 
2880 2890 2900 2910 2920 2930 2940 

X Sau3AI 
x Ndell 
>< Mbol 
x DpnII 

X Dpnl 
>< BspAI 
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>< NlalllX Bspl43I >< Alul >< SfaNI 

AACATGGGTA TTGATCTTGA TGAGTGGAGT GTAGCTACAT TCTACTTATT TGATGATGCT GGTGAAGAAA 
2950 2960 2970 2980 2990 3000 3010 



>< MboII >< Gsul 

>< BsaAI 

>< HphI >< Maelix Bpml >< Mnll 

ACTTTTCATC ACGTATGTAT TGTTCCTTTT ACCCTCCAGA TGAGGAAGAA GAGGACGATG CAGAGTGTGA 
3020 3030 3040 3050 3060 3070 3080 



>< SfaNI 
X Mnll 
x Ksp632I 
X Earl 
X Eamll04I 



X Mnll 
> < MboII 
X MboII 



> < Rsal 
x Rsal 
>< Nlalll 

X Mnll 

X Csp6I 
>< Csp6I 

X MboII > < Afal 

>< MboII >< Afal 

GGAAGAAGAA ATTGATGAAA CCTGTGAACA TGAGTACGGT ACAGAGGATG ATTATCAAGG TCTCCCTCTG 
3090 3100 3110 3120 3130 3140 3150 



X Fokl 
Eco31I X 
X MamI BsmAI x 
X BsiBI Bsal >< 
X BsaBIAlw26I X 



X NlalVX PvuIIX Xmnl 
>< Eco64I >< Psp5I >< TthHB8I 
X Mnll X Ddel X TaqI 

X BscBlX NspBII X Mnll 
>< BanI >< Mnll 

>< AccBlI X Alul >< Asp700I 



X Mnll >< MboII 

X Ksp632I >< MboII x MboII 

>< Earl >< BsrI 

X Eamll04I >< Mbolix Bbsl 



GAATTTGGTG CCTCAGCTGA AACAGTTCGA GTTGAGGAAG AAGAAGAGGA AGACTGGCTG GATGATACTA 
3160 3170 3180 3190 3200 3210 3220 



>< Tru9I 

X Fokl >< Msel >< Eco57I 

X Ddel >< BsrlX MboII BsrI X 

CTGAGCAATC AGAGATTGAG CCAGAACCAG AACCTACACC TGAAGAACCA GTTAATCAGT TTACTGGTTA 
3230 3240 3250 3260 3270 3280 3290 



X Tru9I >< Mnll 

x Msel >< Tru9I >< Hindlix Tru9I >< Dralll 

X Dral >< Msel >< HincIIX Msel >< BspWI 

TTTAAAACTT ACTGACAATG TTGCCATTAA ATGTGTTGAC ATCGTTAAGG AGGCACAAAG TGCTAATCCT 



3300 



3310 



3320 



3330 



3340 



3350 



3360 



>< HphI 

x Fnu4HI 



> < 



Nlalll 
X BspMI 



X Vnel 
X Snol 

> < 

> < 

> < 

> < 

> < 
X ApaLI 
X Alw4 4I 

> < Alw21I 



Sdul 
NspII 
HgiAI 
Bspl286I 
Bmyl 



X Bbvl 

ATGGTGATTG TAAATGCTGC TAACATACAC CTGAAACATG GTGGTGGTGT AGCAGGTGCA CTCAACAAGG 
3370 3380 3390 3400 34L0 3420 3430 



X NlalV 



X Sau96I 
X Pall 

X NspIV 
>< Haelll 

>< Cfrl3I 
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>< Eco€4I >< BsuRI 

>< BscBI > < Tru9I >< BsiZT 

>< BanI > < Msel >< BshI >< Mnll 

>< AccBllX Nlalll >< Alul >< Asul X Mnll 

CAACCAATGG TGCCATGCAA AAGGAGAGTG ATGATTACAT TAAGCTAAAT GGCCCTCTTA CAGTAGGAGG 
3440 3450 3460 3470 3480 3490 3500 

>< SinI 
>< Sau96I 
>< NspIV 
>< NspHlX NspHII 
>< Eco47I 
>< Cfrl3I 
>< Nlalll >< BspMI 
>< BsiZI 
>< Bmel8I 
>< Avail Mnll >< 
> < Ddel >< NspIX Asul Fokl >< 

GTCTTGTTTG CTTTCTGGAC ATAATCTTGC TAAGAAGTGT CTGCATGTTG TTGGACCTAA CCTAAATGCA 
3510 3520 3530 3540 3550 3560 3570 



> < Tru9I 

>< Hphl> < Msel 

X Esp4I 
>< Alul > < Ndel 

X AflllX Enu4HI X Bbvl 

GGTGAGGACA TCCAGCTTCT TAAGGCAGCA TATGAAAATT TCAATTCACA GGACATCTTA CTTGCACCAT 
3580 3590 3600 3610 3620 3630 3640 



Rsal X 
Csp6I x 

X Eco57I >< Bcgl Afal x 

TGTTGTCAGC AGGCATATTT GGTGCTAAAC CACTTCAGTC TTTACAAGTG TGCGTGCAGA CGGTTCGTAC 
3650 3660 3670 3680 3690 3700 3710 



X Bsgl >< BspMI 

X Bcgl/a >< Alul >< Nlalll 

ACAGGTTTAT ATTGCAGTCA ATGACAAAGC TCTTTATGAG CAGGTTGTCA TGGATTATCT TGATAACCTG 
3720 3730 3740 3750 3760 3770 3780 



>< Mnll 

X Rmal > < Mnll >< NlalV x Tfil >< MboII 

X Mael x Eco57I X BscBI x Hinfl x Ddel 

AAGCCTAGAG TGGAAGCACC TAAACAAGAG GAGCCACCAA ACACAGAAGA TTCCAAAACT GAGGAGAAAT 
3790 3800 3810 3820 3830 3840 3850 



X Tru9I 

X StuI 
x Pall 

x Msel >< Mnll >< Maelll 
>< Haelll X Eco0651 

X Ecol47I X Eco91I 

X Rsal >< BsuRI BstXI X 

X Csp6I >< TthHB8 I >< BshI X BstPI 

X Afal X TaqI >< AatI >< BstEII 

CTGTCGTACA GAAGCCTGTC GATGTGAAGC CAAAAATTAA GGCCTGCATT GATGAGGTTA CCACAACACT 
3860 3870 3880 3890 3900 3910 3920 



Tfil x 
Nlalll X 
Hinfl x 

>< Ddel >< EcoRV X Hindlll 
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>< BsrI >< MboII >< Maelll >< Eco32I >< Alul 

GGAAGAAACT AAGTTTCTTA CCAATAAGTT ACTCTTGTTT GCTGATATCA ATGGTAAGCT TTACCATGAT 
3930 3940 3950 3960 3970 3980 3990 



>< Nspl 
>< NspHI 
>< Nlalll 
>< Mnll 

>< Ddel 
>< Ddel >< Bfrl 



>< SfaNI 

> < EcoNI 
X MboII >< BslI 
>< HphI >< BsiYI 



> < Nialll 
>< Fokl 



TCTCAGAACA TGCTTAGAGG TGAAGATATG TCTTTCCTTG AGAAGGATGC ACCTTACATG GTAGGTGATG 
4000 4010 4020 4030 4040 4050 4060 



>< Spel 
>< Rmal 

>< Mae I >< EcoRVX HphI >< SfaNI 

>< HphI >< Eco32I >< Mnll >< Ddel 

TTATCACTAG TGGTGATATC ACTTGTGTTG TAATACCCTC CAAAAAGGCT GGTGGCACTA CTGAGATGCT 
4070 4080 4090 4100 4110 4120 4130 

>< ScrFI 
>< Rsal 

>< Mval 
>< EcoRII 

>< Ecll36I 
>< DsaV 
>< Csp6I >< EcoNI 
>< BstOI 
>< BstNI 
>< BsiLI 
>< BsaJI 
>< BsaAI >< BslI 
>< MboII >< MaellX Apyl 

>< Alul >< BsrI >< Afal >< BsiYI 

CTCAAGAGCT TTGAAGAAAG TGCCAGTTGA TGAGTATATA ACCACGTACC CTGGACAAGG ATGTGCTGGT 
4140 4150 4160 4170 4180 4190 4200 



>< Tru9I 
>< Msel 

>< Ddel >< Esp4I X Rsal 

X Mnll X BspWI X Csp6I 

>< Fokl >< Alul X Aflll >< Eco57l X Afal 

TATACACTTG AGGAAGCTAA GACTGCTCTT AAGAAATGCA AATCTGCATT TTATGTACTA CCTTCAGAAG 



4210 



4220 



4230 



4240 



4250 



4260 



4270 



X BspWI 



X 
Ksp632I 
Earl > 
Eamll04I 
Ddel > 
X 



Xmnl 

X Rmal 

< Tfiix MboII 

X Mael 

< Hinfl 
Asp700I 



>< ScrFI 
X Mval 

X EcoRII 
X EC1136I 

>< DsaV 
x BstOI 
X BstNI 
X BsiLI 
X Apyl 



Nlalll X 
Ksp632I X 

>< Earl 
Eamll04I X 

BscaAI >< 
Alw26I X 



CACCTAATGC TAAGGAAGAG ATTCTAGGAA CTGTATCCTG GAATTTGAGA GAAATGCTTG CTCATGCTGA 
4280 4290 4300 4310 4320 4330 4340 



X Vspl 
X Tru9I 
X Msel 
X MboII 

X Eco57l 



X Zsp2I 
X PpulOI 

X Nsil 

>< Nlalll 
x Mphll03I 



x Fokl 
X Fokl 
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>< Asnl >< EcoT22I >< BspWI 

>< Asel >< Avalll >< Bgll >< Maell 

AGAGACAAGA AAATTAATGC CTATATGCAT GG AT GTT AG A GCCATAATGG CAACCATCCA ACGTAAGTAT 
4350 4360 4370 4380 4390 4400 4410 

X SfaNI 

>< Tru9I > < Hindll >< Tfil >< Spel 

>< Msel > < Hincllx MboII >< Rmal 

>< Mnll >< DrdI >< Hinfl >< Mael 

AAAGGAATTA AAATTCAAGA GGGCATCGTT GACTATGGTG TCCGATTCTT CTTTTATACT AGT AAAGAGC 
4420 4430 4440 4450 4460 4470 4480 

>< Maelll 

>< Sfcl >< Fnu4HI >< Muni 

>< Alul >< Alul >< Acil Mael I I >< 

CTGTAGCTTC TATTATTACG AAGCTGAACT CTCTAAATGA GCCGCTTGTC ACAATGCCAA TTGGTTATGT 
4490 4500 4510 4520 4530 4540 4550 

>< Thai 
>< Mvnl 

>< MboII 
>< HinPlI 
>< HinPlI 

>< Hin6I 
>< Hin6I 

>< Hhal 

>< Tru9I >< Hhal 

>< Nlalll >< Fnu4HI 

>< Msel >< Cfol 

>< Mnll >< Cfol 

>< Ksp632I >< BstUI 

>< Earl >< BssHIIX BspWI >< Tru9I 

>< Eamll04I >< Bsp50I >< Msel 

' >< Bbvl >< AccII >< Alul HphI X 

GACACATGGT TTTAATCTTG AAGAGGCTGC GCGCTGTATG CGTTCTCTTA AAGCTCCTGC CGTAGTGTCA 
4560 4570 4580 4590 4600 4610 4620 

>< Maelll 

>< SfaNI X AlwNI >< Mnll X Mnllx Ddel 

GTATCATCAC CAGATGCTGT TACTACATAT AATGGATACC TCACTTCGTC ATCAAAGACA TCTGAGGAGC 
4630 4640 4650 4660 4670 4680 4690 

>< SinI 
>< Sau96I 
>< NspIV 
X NspHII 

X Sdul >< Eco47l 

>< NspII >< Cfrl3I 

>< HgiAI >< BsiZI 

>< Bspl286I X Bmel8I x Rsal 

x Bmyl >< Avail >< Csp6I 

X Alw21I >< Asul X Afal 

ACTTTGTAGA AACAGTTTCT TTGGCTGGCT CTTACAGAGA TTGGTCCTAT TCAGGACAGC GTACAGAGTT 
4700 4710 4720 4730 4740 4750 4760 

> < TthHB8 I 

> < TaqI 
X Sdul 

>< Van91I x NspII 

X Tru9I X Rsal >< PflMI >< Eco24I 

>< Msel >< HphI >< BslI x Bspl286I 

>< Esp4I X Csp6I X BsiYI >< Bmyl Gsul X 
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>< Aflll >< Maelll >< Afal >< AccB7I >< BanllBpml >< 

AGGTGTTGAA TTTCTTAAGC GTGGTGACAA AATTGTGTAC CACACTCTGG AGAGCCCCGT CGAGTTTCAT 
4770 4780 4790 4800 4810 4820 4830 

>< Tru9I 
>< Plel >< EcoNI 
>< Mnll >< BslI 
>< BsmAI >< BsiYI 

>< Mnll >< Hphl >< Hinfix Alw26I>< Acil >< Msel 

CTTGACGGTG AGGTTCTTTC ACTTGACAAA CTAAAGAGTC TCTTATCCCT GCGGGAGGTT AAGACTATAA 
4840 4850 4860 4870 4880 4890 4900 

>< Alul >< Ndel 

AAGTGTTCAC AACTGTGGAC AACACTAATC TCCACACACA GCTTGTGGAT ATGTCTATGA CAT AT GG AC A 
4910 4920 4930 4940 4950 4960 4970 

>< SinI 
>< Sau96I 
>< NspIV* 

>< NspHII 
>< Eco47I 

>< Cfrl3I Nlalll >< 

>< BsiZI >< Nlalll 

>< Bmel8I > < Mnll 

>< Avail >< Maelll >< Tru9I >< Mnll 

>< Asul >< Fokl X Msel >< BspHI 

GCAGTTTGGT CCAACATACT TGGATGGTGC TGATGTTACA AAAATTAAAC CTCATGTAAA TCATGAGGGT 
4980 4990 5000 5010 5020 5030 5040 

> < TthHB8I 

>< Rsal > < TaqI 

> < Rmal >< SnaBI >< Seal 

> < Mael >< Maell >< Hindlll >< Rsal 
>< Csp6I >< EcolOSI >< Csp6I 

X Afal >< BsaAI >< Alul >< Afal 

AAGACT TTCT TTGTACTACC TAGTGATGAC AC ACT ACGT A GTGAAGCTTT CG AG TACT AC CATACTCTTG 

5050 5060 5070 5080 5090 5100 5110 

x Rsal 

>< Nspl 
x NspHI 
X Nlalll 

> < Csp6I >< Tru9I Mnll > 

>< Afllll >< Msel BslI x 

X Afal >< Dral BsiYI >< 

ATGAGAGTTT TCTTGGTAGG TACATGTCTG CTTTAAACCA CACAAAGAAA TGGAAATTTC CTCAAGTTGG 
5120 5130 5140 5150 5160 5170 5180 

>< Tru9I >< Tru9I >< Rmal 

x Msel x Msel >< Muni >< Mael Alul > 

TGGTTTAACT TCAATTAAAT GGGCTGATAA CAATTGTTAT TTGTCTAGTG TTTTATTAGC ACTTCAACAG 
5190 5200 5210 5220 5230 5240 5250 

X SfaNI 
>< Sdul 
>< NspII 
x Eco24I 
x Bspl286I 
>< Bmyl Hphl > 

>< Bbvl Fnu4HI X 
>< Mnll >< Banll x BspWI 
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CTTGAAGTCA AATTCAATGC ACCAGCACTT CAAGAGGCTT ATTATAGAGC CCGTGCTGGT GATGCTGCTA 
5260 5270 5280 5290 5300 5310 5320 



>< Vnel 
>< Snol 

>< Sdul 

>< NspII 

>< HgiAI 

>< Bspl286I 

>< Bmyl 
>< ApaLI 

>< Alw4 4I MboII >< 

>< Alw21I >< Alul >< HphI 

ACTTTTGTGC ACTCATACTC GCTTACAGTA ATAAAACTGT TGGCGAGCTT GGTGATGTCA GAGAAACTAT 
5330 5340 5350 5360 5370 5380 5390 



> < SphI 

> < Pael 

> < Nspl 

> < NspHI >< Tfil >< Tru9I 
>< Sfcl > < Nlallix Hinfl >< Msel 

GACCCATCTT CTACAGCATG CTAATTTGGA ATCTGCAAAG CGAGTTCTTA ATGTGGTGTG TAAACATTGT 

5400 5410 5420 5430 5440 5450 5460 



>< Rsal 

>< Tru9I > < Csp6I Esp4I > 

>< Msel >< Alul >< Afal Aflll > 

GGTCAGAAAA CTACTACCTT AACGGGTGTA GAAGCTGTGA TGTATATGGG TACTCTATCT TATGATAATC 

5470 5480 5490 5500 5510 5520 5530 



>< Rsar 

>< MboII 
>< RmalHinfl >< 
X Csp6I 

>< Tru9I >< SfaNI >< Mael >< Bbsl 

>< Msel >< Nlalll >< Afar 

TTAAGACAGG TGTTTCCATT CCATGTGTGT GTGGTCGTGA TGCTACACAA TATCTAGTAC AACAAGAGTC 
5540 5550 5560 5570 5580 5590 5600 



>< Rsal 

>< Plel > < Ddel >< Csp6I 

X Bsgl x BspWI >< BspMI X Afal 

TTCTTTTGTT ATGATGTCTG CACCACCTGC TGAGTATAAA TTACAGCAAG GTACATTCTT ATGTGCGAAT 
5610 5620 5630 5640 5650 5660 5670 



>< Eco31I 

>< Rsal >< Ddel 

> < Maelll >< BsmAI 

X Csp6I >< Bsal Mnll X 

X Afal X BsrI >< Alw26l HphI > 

GAGTACACTG GTAACTATCA GTGTGGTCAT TACACTCATA TAACTGCTAA GGAGACCCTC TATCGTATTG 
5680 5690 5700 5710 5720 5730 5740 



>< SstI 
X Sdul 
X SacI 
X NspII 
>< HgiAI 
X Eco24I 
X EC1136II 
x Bspl286I 
X Bmyl 



X SinI 
>< Sau96I 
X NspIV 
X NspHII 
> < Rsal >< Maeril 

X Eco47I 
>< Cfrl3I 
X BsiZI 
X Bmel8I 
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>< Banll >< Avail 

>< Alw21I >< Csp6I>< Asul 

>< Alul > < Afal >< BsrlX AlwNI 

ACGGAGCTCA CCTTACAAAG ATGTCAGAGT ACAAAGGACC AGTGACTGAT GTTTTCTACA AGGAAACATC 
5750 5760 5770 5780 5790 5800 5810 

>< TthHB8 I 

>< TaqI >< Maelll 

TTACACTACA ACCATCAAGC CTGTGTCGTA TAAACTCGAT GGAGTTACTT ACACAGAGAT TGAACCAAAA 
5820 5830 5840 5850 5860 5870 5880 

>< Rsal 
>< Csp6I 
X Sfcl X Bbvl 
>< Fokl >< Fnu4HI >< Afal 

TTGGATGGGT ATTATAAAAA GGATAATGCT TACTATACAG AGCAGCCTAT AGACCTTGTA CCAACTCAAC 
5890 5900 5910 5920 5930 5940 5950 

Tru9I >< 
Swal >< 
Msel >< 

> < Nspl MamI >< 

> < NspHI Dral >< 

> < Nlalll BsiBI >< 
X Afllll BsaBI x 

CATTACCAAA TGCGAGTTTT GATAATTTCA AACTCACATG TTCTAACACA AAATTTGCTG ATGATTTAAA 
5960 5970 5980 5990 6000 6010 6020 

>< MboII 
>< Alul X AluIX Maelll 

T CAAATGAC A GGCTTCACAA AGCCAGCTTC ACGAGAGCTA TCTGTCACAT TCTTCCCAGA CTTGAATGGC 
6030 6040 6050 6060 6070 6080 6090 

X Sfcl 

GATGTAGTGG CTATTGACTA TAGACACTAT TCAGCGAGTT TCAAGAAAGG TGCTAAATTA CTGCATAAGC 
6100 6110 6120 6130 6140 6150 6160 

X Tru9I 

X ScrFI 
>< Mval 
x Msel 

>< EcoRII 

x Ecll36I 
X DsaV 

X BstOI 

>< BstNI Maell x 

>< Muni X BsiLI X Dralll 

X BstXI X Apyl x Maell >< BstXI 

CAATTGTTTG GCACATTAAC CAGGCTACAA CCAAGACAAC GTTCAAACCA AACACTTGGT GTTTACGTTG 

6170 6180 6190 6200 6210 6220 6230 

> < Rsal 

X Csp6I MboII X 

> < Afalx BsrI >< Bbsl 
TCTTTGGAGT ACAAAGCCAG TAGATACTTC AAATTCATTT GAAGTTCTGG CAGTAGAAGA CACACAAGGA 

6240 6250 6260 6270 6280 6290 6300 

X Hindll X MboII 

>< Hindi >< Mnll X Eco57l 

ATGGACAATC TTGCTTGTGA AAGTCAACAA CCCACCTCTG AAGAAGTAGT GGAAAATCCT ACCATACAGA 
6310 6320 6330 6340 6350 6360 6370 
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>< Maelll >< Tru9I 

>< Maell >< Msel 

AGGAAGTCAT AGAGTGTGAC GTGAAAACTA CCGAAGTTGT AGGCAATGTC ATACTTAAAC CAT CAG ATGA 
6380 6390 6400 6410 6420 6430 6440 

>< XhoII 
>< Sau3AI 
>< Nlalll 
>< Ndell 
>< Mfll 
>< Mbol 
>< DpnII 

>< Dpnl 
>< BstYI 

>< Tru9I >< BspAI 

>< Msel >< BspHI >< Bspl43I>< Fnu4HI 

> < Maelll >< Mnll >< Bbvl >< Alwl 

AGGTGTTAAA GTAACACAAG AGTTAGGTCA TGAGGATCTT ATGGCTGCTT ATGTGGAAAA CACAAGCATT 
6450 6460 6470 6480 6490 6500 6510 

>< Saul 
>< Rmal 

>< Mstll 
>< Mael 

>< Eco81I 

X Ddel 

x Cvnl 

x Bsu36I 

x Bse21I 

>< Bfrl> < Tru9I 

>< Tru9I x Axyl> < Mseix Muni x Nlalll 

X Msel >< Alul >< AocI X Dral X Bbvl Fnu4HI >< 

ACCATTAAGA AACCTAATGA GCTTTCACTA GCCTTAGGTT TAAAAACAAT TGCCACTCAT GGTATTGCTG 
6520 6530 6540 6550 6560 6570 6580 



x Vspl 
X Tru9I 
>< Msel 
X Asnl 
x Asel 



>< Styl 
>< EcoT14I 
>< Ecol30I 
>< BssTlI 
>< BsaJI 



> < Ddel 
x BslI 
x BsiYI 

> < Bfrl 



X Fnu4HI 



CAATTAATAG TGTTCCTTGG AGTAAAATTT TGGCTTATGT CAAACCATTC TTAGGACAAG CAGCAATTAC 
6590 6600 6610 6620 6630 6640 6650 



X Bbvl 



X HinPlI 
X Hin6I 

>< Hhal 
>< Ddel 

>< Cfol 



>< Tru9I 
>< Maelix Msel 

X Drain 
X Afllll 



AACATCAAAT TGCGCTAAGA GATTAGCACA ACGTGTGTTT AAC AAT TATA TGCCTTATGT GTTTACATTA 
6660 6670 6680 6690 6700 6710 6720 

>< Rsal > < Rsaix Xbal 

x Csp61 x Csp6l >< Rmal 

X Muni x Afal > < Afal X Mael X Alul 

TTGTTCCAAT TGTGTACTTT T ACT AAAAGT ACCAATTCTA GAATTAGAGC TTCACTACCT ACAACTATTG 
6730 6740 6750 6760 6770 6780 6790 



X Vspl 
X Tru9I 
>< Nael 
>< Mspl 

>< Msel 
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X Hpall 
>< Hapir 
>< CfrlOr >< Fokl 
>< Tru9I >< Asnl 

>< Msel >< SfaNI >< Aselx Hphlx Maelll 

CTAAAAATAG TGTTAAGAGT GTTGCTAAAT TATGTTTGGA TGCCGGCATT AATTATGTGA AGTCACCCAA 
6800 6810 6820 6830 6840 6850 6860 

>< Tru9I >< Ddel Maelll > 

>< Msel >< Bfrl >< Bbvl 

ATTTTCTAAA TTGTTCACAA TCGCTATGTG GCTATTGTTG TTAAGTATTT GCTTAGGTTC TCTAATCTGT 

6870 6880 6890 6900 6910 6920 6930 



X Sdul 
>< NspII 
>< HgiAI 

> < Rsal >< Bspl286I 

>< Csp6I >< Bmyl 

>< Fnu4HI > < Afal >< Alw21I 

GTAACTGCTG CTTTTGGTGT ACTCTTATCT AATTTTGGTG CTCCTTCTTA TTGTAATGGC GTTAGAGAAT 
6940 6950 6960 6970 6980 6990 7000 



Tru9I >< 
Msel >< 

>< Tru9I > < Maelll x Fnu4HI 

X Msel x Maell Bbvl > 

TGTATCTTAA TTCGTCTAAC GTTACTACTA TGGATTTCTG TGAAGGTTCT TTTCCTTGCA GCATTTGTTT 
7010 7020 7030 7040 7050 7060 7070 

> < Tfil Rsal X 

>< MamI >< HphI 

> < Hinfl Csp6I >< 

>< BsiBI X Xmnix Maelll Alul > 

>< PlelX Hinfl x BsaBI X Alul X Asp700I Afal x 

AAGTGGATTA GACTCCCTTG ATTCTTATCC AGCTCTTGAA ACCATTCAGG TGACGATTTC ATCGTACAAG 
7080 7090 7100 7110 7120 7130 7140 



X Pall 

X NspBII 
>< Haelll 
>< Gdill 

X Fnu4HI 
X Eael 

X Ddel 
X BsuRI 

>< Rmal x BshI x BslI 

X Mael X AcilX BsiYI 

CTAGACTTGA CAATTTTAGG TCTGGCCGCT GAGTGGGTTT TGGCATATAT GTTGTTCACA AAATTCTTTT 
7150 7160 7170 7180 7190 7200 7210 



>< BspMI X Rmal 

x Alul >< Mael 

ATTTATTAGG TCTTTCAGCT ATAATGCAGG TGTTCTTTGG CTATTTTGCT AGTCATTTCA TCAGCAATTC 

7220 7230 7240 7250 7260 7270 7280 



Rsal X 
>< MboII 
>< NlalV MamI X 

x Eco64 I Csp6I >< 

> < Rsal x BscBI BsiBI X 

x Csp6I x BanI BsaBI X 

> < Nlalll > < Afalx AccBlI Afal x 

FIGURE 13.17 
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TTGGCTCATG TGGTTTATCA TTAGTATTGT ACAAATGGCA CCCGTTTCTG CAATGGTTAG GATGTACATC 
7290 7300 7310 7320 7330 7340 7350 



>< Fokl 



>< Ndel 
>< Ksp632I 
>< Earr 
>< Eamll04I>< AlulX MboII 



TthHB8I X 

>< TaqI 
Mnll >< 
Ksp632I >< 
X Fokl 
>< MboII Earl x 
x Nlalll EamlL04I X 



TTCT TTGCTT CTTTCTACTA CATATGGAAG AGCTATGTTC AT AT CATGG A TGGTTGCACC TCTTCGACTT 



7360 



7370 



7380 



7390 



7400 



7410 



7420 



XhoII 
Sau3AI 
Nlalll X 
NdeH 



X 
X 



X 
X 
X 



X Thai > < 

X Mvnl > < 

x HinPlI x Mlul > < 
X Hin6I >< BstUI 

>< Hhal X BspSOI >< Rsal 

>< Nlalll X Cfol X Afllll X Csp6I >< Tru9I 

X BspWI X BspWI >< AccII X Afal X Msel 
GCATGATGTG C T AT AAGCGC AATCGTGCCA CACGCGTTGA GTGTACAACT ATTGTTAATG GCATGAAGAG 

7430 7440 7450 7460 7470 7480 7490 



Mfll 
Mbol 
Ksp632I 
Earl 

Eamll04r 
Dpnri X 
BstYI X 
BspAr X 
Bglll X 



x Pair 
>< Haeril 

X Dsal >< Muni 

X MboII x BsuRI Maelll x 

X Dpnl >< BshI >< Muni BsmAI X 

x Bspl43I X Mnll X BsaJI X Plelx Hinfl Alw26I >< 

ATCTTTCTAT GTCTATGCAA ATGGAGGCCG TGGCTTCTGC AAGACTCACA ATTGGAATTG TCTCAATTGT 

7500 7510 7520 7530 7540 7550 7560 

>< Rsal Tru9I x 

> < Csp6I Msel x 

x BsrI x Gsul >< MaelllDral x 

>< Afal x Bpral > < BsrI 

GACACATTTT GCACTGGTAG TACATTCATT AGTGATGAAG TTGCTCGTGA TTTGTCACTC CAGTTTAAAA 

7570 7580 7590 7600 7610 7620 7630 



X Thai 
X Mvnl 
> < HphI 
HinPlI >< 

x HinPlI 

x Hin6I 
>< Hin6I 
Hhal x 

>< Hhal 
Cfol x 
x Cfol 
>< BstUI 
X BssHII 
Bsp50I X 

> < BsrI >< AccII 

GACCAATCAA CCCTACTGAC CAGTCATCGT ATATTGTTGA TAGTGTTGCT GTGAAAAATG GCGCGCTTCA 
7640 7650 7660 7670 7680 7690 7700 
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Fokl 



>< BsmAI 

>< Mnll >< Alw26I >< Acil 

CCTCTACTTT GACAAGGCTG GTCAAAAGAC CTATGAGAGA CATCCGCTCT CCCATTTTGT CAATTTAGAC 
7710 7720 7730 7740 7750 7760 7770 

>< Vspl 
>< Tru9I 
>< Msel 
>< Asnl 

> < Alul >< Asel >< Bcgl/a 

AAT TTGAG AG CTAACAACAC TAAAGGTTCA CTGCCTATTA ATGTCATAGT TTTTGATGGC AAGTCCAAAT 
7780 7790 7800 7810 7820 7830 7840 



>< Hinfl 



>< Plel 
>< Ddel 



>< Bcgl 



>< Sfcl 
>< Rsal 
>< Csp6I 
>< Afal 



>< PvuII 
>< Psp5I 
>< NspBII 
>< Alul 



GCGACGAGTC TGCTTCTAAG TCTGCTTCTG TGTACTACAG TCAGCTGATG TGCCAACCTA TTCTGTTGCT 
7850 7860 7870 7880 7890 7900 7910 



>< Alul 



>< Mae I I 



>< Seal 
>< Rsal 
>< Csp6I 
>< Afal 



TthHB8I >< 
TaqI >< 
Sail >< 
Rtrl >< 
Hindll > 

>< Tru9I Hindi > 

>< SfaNI >< Eco57I 
>< Msel AccI >< 



TGACCAAGCT CTTGTATCAG ACGTTGGAGA TAGTACTGAA GTTTCCGTTA AGATGTTTGA TGCTTATGTC 
7920 7930 7940 7950 7960 7970 7980 

>< Tru9I 
>< Msel 

> < Esp4I >< Sfcl 

> < Aflll >< BspWI >< Alul 
GACACCTTTT CAGCAACTTT TAGTGTTCCT ATGGAAAAAC T T AAGGCACT TGTTGCTACA GCTCACAGCG 

7990 8000 8010 8020 8030 8040 8050 

>< PvuII 
>< PspSI 
>< NspBII 
>< Fnu4HI 

>< Alul X Bbvl X Alul 

AGT T AGC AAA GGGTGTAGCT TTAGATGGTG TCCTTTCTAC ATTCGTGTCA GCTGCCCGAC AAGGTGTTGT 
8060 8070 8080 8090 8100 8110 8120 

Maelll >< 

>< Hindll >< BsmAI >< Ddel 

x Hindi X Fokix Alw26I >< Bfrl 

TGATACCGAT GTTGACACAA AGGATGTTAT TGAATGTCTC AAACTTTCAC ATCACTCTGA CTTAGAAGTG 
8130 8140 8150 8160 8170 8180 8190 



X XhoII 
Sau3AI x 

X Ndell 
>< Mfll 
X Mbol 
X Nlalll X Hgal 
>< Hinll >< DpnII 
Dpnl X 
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Bspl43I >< 
>< BsaHI >< BstYI 

>< Maellix HphI >< B biII >< BspAI 

>< Maelll >< HphI >< Nlalll >< Acyl >< BgLII 

ACAGGTGACA GTTGTAACAA TTTCATGCTC ACCTATAATA AGGTTGAAAA CATGACGCCC AGAGATCTTG 
8200 8210 8220 8230 8240 8250 8260 

X Nspl 

>< NspHI 

>< Nlalll 
>< HinPlI 
>< Hin6I 
>< Hhal 

>< Cfol >< BspWI >< Maelll 

GCGCATGTAT TGACTGTAAT GCAAGGCATA TCAATGCCCA AGTAGCAAAA AGTCACAATG TTTCACTCAT 
8270 8280 8290 8300 8310 8320 8330 

>< Nspl 

>< NspHI X PvuII 

>< Nlalll X PspSI 

X EamllOSI >< NspBII 

>< Bbvl >< Fnu4HI 

>< Afllll x Alul >< Bbvl > < Fnu4HI 

CTGGAATGTA AAAGACTACA TGTCTTTATC TGAACAGCTG CGTAAACAAA TTCGTAGTGC TGCCAAGAAG 

8340 8350 8360 8370 8380 8390 8400 

X Rmal 

X MboII >< Mael x EamllOSI 

AACAACATAC CTTTTAGACT AACTTGTGCT ACAACTAGAC AGGTTGTCAA TGTCATAACT ACTAAAATCT 
8410 8420 8430 8440 8450 8460 8470 

>< Tru9I 

x Pall 
x Msel 

x Haelll 
x Seal x Esp4I 

>< Rsal X Tru9I X BsuRI 

x Csp6I x Msel x BshI 

X Afal X Dral X Aflll x Bbvl 

CACTCAAGGG TGGTAAGATT GTTAGTACTT GTTTTAAACT TATGCTTAAG GCCACATTAT TGTGCGTTCT 
8480 8490 8500 8510 8520 8530 8540 

X Rsal 
>< Csp6I 

>< BsrI >< Nlalll 

>< Fnu4HI >< Afal x Maelll 

TGCTGCATTG GTTTGTTATA TCGTTATGCC AGTACATACA TTGTCAATCC ATGATGGTTA CACAAATGAA 
8550 8560 8570 8580 8590 8600 8610 

x MaeHI 
> < Maelll 

X Maelll X Fokl 

ATCATTGGTT AC AAAG C CAT TCAGGATGGT GTCACTCGTG ACATCATTTC TACTGATGAT TGTTTTGCAA 
8620 8630 8640 8650 8660 8670 8680 

Sfcl > 

>< NspT Fnu4HI >< 

>< NspHI X Nlalll Bbvl >< 

>< Nlalll x Hgal X BstXI X Bbvl x AluT 

ATAAACATGC TGGTT TTGAC GCATGGTTTA GCCAGCGTGG TGGTTCATAC AAAAATGACA AAAGCTGCCC 
8690 8700 ' 8710 8720 8730 8740 8750 
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>< ScrFI 
>< ScrFI >< Rsal 

>< Mval >< Mspl 
>< EcoRII >< Hpall 
>< Ecll36I>< Neil 
>< DsaV >< HapII 
>< BstOlx DsaV 
>< BstNI >< Csp6I 

>< Fnu4HI >< BsiLI >< BcnIDdel >< 

>< Alul >< Apyl >< Afal 

TGTAGTAGCT GCTATCATTA CAAGAGAGAT TGGTTTCATA GTGCCTGGCT TACCGGGTAC TGTGCTGAGA 
8760 8770 8780 8790 8800 8810 8820 

> < Maelll >< HphI >< Mnll >< BspWI 

GCAATCAATG GTGACTTCTT GCATTTTCTA CCTCGTGTTT TTAGTGCTGT TGGCAACATT TGCTACACAC 
8830 8840 8850 8860 8870 8880 8890 

Tru9I > 
SfaNI >< 
>< Rsal 
Msel > 

>< BspWI >< Fnu4HI >< Csp6I 

>< BbvIX Mnll >< Ddel >< Aral 

CTTCCAAACT CAT TG AGT AT AGTGATTTTG CTACCTCTGC TTGCGTTCTT GCTGCTGAGT GTACAATTTT 
8900 8910 8920 8930 8940 8950 8960 

> < Rmal 
>< Mnll 

>< Fokl > < Mael 

TAAGGATGCT ATGGGCAAAC CTGTGCCATA TTGTTATGAC ACTAATTTGC TAGAGGGTTC TATTTCTTAT 
8970 8980 8990 9000 9010 9020 9030 



>< NlalV 

>< 

>< Alul >< BscBI 

AGTGAGCTTC GT CC AG AC AC TCGTTATGTG CTTATGGATG GTTCCATCAT 



9040 



9050 



9060 



9070 



9080 



ScrFI > 
Mval > 
Mnll >< 
EcoRII >< 
Ecll36I > 
DsaV >< 
BstOI > 
BstNI > 

Fokl BsiLI > 

Apyl > 

ACAGTTTCCT AACACTTACC 
9090 9100 



>< SfaNI 
> < Maelll 
>< Gsul 
>< Bpml 



>< 



>< Sfcl 
>< Seal 
>< Rsal 
>< Csp6I 
>< Afal 
Ddel >< AccI 



>< Rsal 

>< Nspl 
X NspHI 
>< Nlalll 
>< Nlalll 
>< Csp6I 
>< Afal 



TGGAGGGTTC TGTTAGAGTA GTAACAACTT TTGATGCTGA GTACTGTAGA CATGGTACAT GCGAAAGGTC 
9110 9120 9130 9140 9150 9160 9170 



>< SstI 
>< Sdul 
>< SacI 



Nspl I >< 
HgiAI 
Eco24I 
Bspl286I >< 
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>< BsrI 



>< Tru9I 
X Msel 



Ecll36II ><>< Brayl 
Banll x 
Alw21I X 

X Alul 



AGAAGTAGGT ATTTGCCTAT CTACCAGTGG TAGATGGGTT CTTAATAATG AGCATTACAG AGCTCTATCA 



9180 



9190 



9200 



9210 



9220 



9230 



9240 



X Tfil 

>< SfaNI >< Hinfl X Alul >< Mnll 

GGAGTTTTCT GTGGTGTTGA TGCGATGAAT CTCATAGCTA ACATCTTTAC TCCTCTTGTG CAACCTGTGG 
9250 9260 9270 9280 9290 9300 9310 

>< Maelll 

HphI X 

X Eco57I > < Bbvl Fnu4HI X 

GTGCTTTAGA TGTGTCTGCT TCAGTAGTGG CTGGTGGTAT TATTGCCATA TTGGTGACTT GTGCTGCCTA 
9320 9330 9340 9350 9360 9370 9380 



>< Rsal 
>< Csp6I >< Nlalll 
>< Maell >< Bbvl X Fnu4HI 

X Afllll X AfalX HphI X BspWI 

CTACTTTATG AAAT T C AG AC GTGTTTTTGG TGAGTACAAC CATGTTGTTG CTGCTAATGC ACTTTTGTTT 



9390 



9400 



9410 



9420 



9430 



9440 



9450 



X Rsal 

>< NlalV 
X Kpnl 
X Eco64I 
X Csp6I 

>< BscBI 
>< Asp718 
X BanI X Alul 

>< Afal 
X AccBlI 
X Acc65I 



> < ScrFI 

> < Neil 
X Mspl 
X Hpall 

X Hinfl 
X HapII x Plel 

> < Bcnl > < Ddel 
X AluIX DsaV X AccI 



TTGATGTCTT TC ACT AT ACT CTGTCTGGTA CCAGCTTACA GCTTTCTGCC GGGAGTCTAC TCAGTCTTTT 
9460 9470 9480 9490 9500 9510 9520 

>< Rsal 
X Csp6I 

X Afal X HphI X HphI Nlalll X 

ACTTGTACTT GACATTCTAT TTCACCAATG ATGTTTCATT CTTGGCTCAC CTTCAATGGT TTGCCATGTT 
9530 9540 9550 9560 9570 9580 9590 

TTCTCCTATT GTGCCTTTTT GGATAACAGC AATCTATGTA TTCTGTATTT CTCTGAAGCA CTGCCATTGG 
9600 9610 9620 9630 9640 9650 9660 

>< TthHB8 I 
X Rsal 
X Mnll 
>< Mnll 

X Tru9I X Csp6l 

X Tru9I >< Plel X Bcgl/a x TaqI 

X Msel X Ddel >< Nlalll >< Bbvl 

>< Eco57I >< Bfrl >< Hinfl >< Msel x Maelll >< Afal Fnu4HI X 

TTCTTTAACA ACTATCTTAG GAAAAGAGTC ATGTTTAATG G AG T TAG ATT TAGTACCTTC GAGGAGGCTG 
9670 9680 9690 9700 9710 9720 9730 



X Rsal 
X Csp6I 

x Bcgl 



>< Rsal 
X Csp6I 

FIGURE L3.22 



>< BsmAI 
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>< Afal >< Afal X Alw26I 

CTTTGTGTAC CTTTTTGCTC AACAAGGAAA TGTACCTAAA ATTGCGTAGC GAG AC ACT GT TGCCACTTAC 
9740 9750 9760 9770 9780 9790 9800 

>< NlalV 
>< Rsal >< Ddel 

>< Csp6I >< BscBI 

>< Afal >< Bfrl Alul >< 

ACAGTATAAC AGGTATCTTG CTCTATATAA CAAGTACAAG TATTTCAGTG GAGCCTTAGA TACTACCAGC 
9810 9820 9830 9840 9850 9860 9870 

>< Fnu4HI 

>< Ddel 

>< Fnu4HI >< Bfrl 

>< Bbvl X Alul >< Bbvl >< Ddel >< AlwNI 

TATCGTGAAG CAGCTTGCTG CCACTTAGCA AAGGCTCTAA ATGACTTTAG CAACTCAGGT GCTGATGTTC 
9880 9890 9900 9910 9920 9930 9940 

>< Sfcl >< BsmI 

>< PstI >< BscCI 

TCTACCAACC ACCACAGACA TCAATCACTT CTGCTGTTCT GCAGAGTGGT TTTAGGAAAA TGGCATTCCC 
9950 9960 9970 9980 9990 10000 10010 



>< Rsal 
X Nlalll 

>< Maelll 

x Csp6I X Tru9I 

X Afal x Msel 

GTCAGGCAAA GTTGAAGGGT GCATGGTACA AGTAACCTGT GGAACTACAA CTCTTAATGG ATTGTGGTTG 



10020 



10030 



10040 



10050 



1CT060 



10070 



10080 



X Fokl 
>< Bstll07I 
X AccI 



>< Nspl 
>< NspHI 
X Nlalll 
X Afllll 



X Tru9I 
X Nspl 
X NspHI 
X Nlalll 
>< Msel 

X MboII BspAI X 
> < Bbsl Bglll X 



XhoII 
Sau3AI 
Ndell 
Mfll 
Mbol 
DpnII 
BstYI 



X 
X 
X 
X 
X 
X 
X 



GATGACACAG TATACTGTCC AAGACATGTC AT T T G C AC AG CAGAAGACAT GCTTAATCCT AACTATGAAG 
10090 10100 10110 10120 10130 10140 10150 

Pall > 
Msel > 
Haelll > 
Eael x 
BsuRI > 

>< Dpnl >< MboII BshI > 

X Bspl43I x Alul Ball > 

ATCTGCTCAT TCGCAAATCC AACCATAGCT TTCTTGTTCA GGCTGGCAAT GTTCAACTTC GTGTTATTGG 
10160 10170 10180 10190 10200 10210 10220 

>< Ddel> < Tru9I 

X Bfrl> < Msel >< Ddel 

CCATTCTATG CAAAATTGTC TGCTTAGGCT TAAAGTTGAT ACTTCTAACC CTAAGACACC CAAGTATAAA 
10230 10240 10250 10260 10270 10280 10290 



X ScrFI 
X MvaX 
X EcoRIX 
X Ecll36I 



x SphI 
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>< DsaV >< Pael 

>< BstOI >< Nspl 

>< BstNI >< NspHI 

X BsiLI >< Rmal >< Nlalll 

>< Apyl >< Mael >< HphI 
TTTGTCCGTA TCCAACCTGG TCAAACATTT TCAGTTCTAG CATGCTACAA TGGTTCACCA TCTGGTGTTT 

10300 10310 10320 10330 10340 10350 10360 



>< Sau3AI 
>< Ndell 

>< Mboix Nlalll 
>< Eco31I >< DpnII 

>< BsmAI >< Tru9I>< Dpnl 

>< Bsalx Nlalll >< Tru9I >< Msel >< Bspl43I 

>< Alw26I >< Msel >< BspAIX Alwl 

ATCAGTGTGC CATGAGACCT AATCATACCA TTAAAGGTTC TTTCCTTAAT GGATCATGTG GTAGTGTTGG 
10370 10380 10390 10400 10410 10420 10430 



>< Zsp2I 
>< PpulOI 

>< NsilX SfaNI 
x Ndel 

>< Mphll03I Rsal X 

X Tru9I X EcoT22I Csp6I >< 

>< Msel > < Avalll >< Alul Afal X 

TTTTAACATT GATTATGATT GCGTGTCTTT CTGCTATATG CATCATATGG AGCTTCCAAC AGGAGTACAC 
10440 10450 10460 10470 10480 10490 10500 



X SinI 
>< Sau96I 
>< NspIV 

>< NspHII X Sfcl 

>< Eco47I Rsal >< 

>< Cfrl3I PstI >< 

X BsiZI X Fnu4HI 

>< Rsal x Bmel8I X Hindll Csp6I X 

X Csp6I>< Ddel >< Avail X Hindi X BspWI 

X AfalX Bfrl X AsuIX Bsgl X Bbvl X BspMI Afal >< 
GCTGGTACTG ACTTAGAAGG TAAATTCTAT GGTCCATTTG TTGACAGACA AACTGCACAG GCTGCAGGTA 

10510 10520 10530 10540 10550 10560 10570 

X Tru9I X Nlalll 

X Msel x Bbvl >< Fnu4HI HphI X 
CAGACACAAC CATAACATTA AATGTTTTGG CATGGCTGTA TGCTGCTGTT ATCAATGGTG ATAGGTGGTT 

10580 10590 10600 10610 10620 10630 10640 



X Tru9I 

>< Tfil 

>< Msel >< Rsal 

X HphI x Tru9I >< Csp6I 

X Hinfl x Msel >< Afal 
TCTTAATAGA TTCACCACTA CTTTGAATGA CTTTAACCTT GTGGCAATGA AGTACAACTA TGAACCTTTG 

10650 10660 10670 10680 1069O 10700 10710 



X SinI 

>< Sau96I 

x PssI 
>< Psp5II 

>< PpuMI 

>< NspIV 
X NspHII 
X NlalV 



FIGURE 13. 24 
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>< EcoO109I 
X Eco47I 
X Drall 
X Cfrl3I 
>< BsiZI 
>< BscBI 

>< Bmel8I >< Ddel 

X Avail X Bfrl 

>< Asul >< Mnll X Bbvl 

ACACAAGATC ATGTTGACAT ATTGGGACCT CTTTCTGCTC AAACAGGAAT TGCCGTCTTA GATATGTGTG 
10720 10730 10740 10750 10760 10770 10780 



X Sau3AI 
X Ndell 
>< Mbol 

x Dpnlix Nlalll 
x Dpnl >< Hindll 

>< BspAI >< Hindi 
>< Bspl43I 



x 



X Fnu4HI 

X Bbvl 
X Bbvl 



X Sfcl 
>< Fnu4HI 
X Fnu4HI 
>< Alul X PstI 



> < 



X 

Rsal 

X 
X 
Csp6I 

X 
X 

x Afal 



Styl 

EcoT14I 
Ecol30I 

BssTlI 
BsaJI 



CTGCTTTGAA AGAGCTGCTG CAGAATGGTA TGAATGGTCG TACTATCCTT GGTAGCACTA TTTTAGAAGA 
10790 10800 10810 10820 10830 10840 10850 

X Styl 

x EcoT14I 

X Ecol30I 

X BssTlI 

>< MboII > < Maellix BsaJI 

TGAGTTTACA CCATTTGATG TTGTTAGACA ATGCTCT GGT GTTACCTTCC AAGGTAAGTT CAAGAAAATT 
10860 10870 10880 10890 10900 10910 10920 



X Tru91> 
X Msel > 



x SfaNI 

< Sdul 

< Nspl I 

< Bspl286I 

< Bmyl 



>< Tru9I Rsal x 

>< Msel >< Tfil Csp6I x 

>< Fokl >< Hinfl Afal >< 

GTTAAGGGCA CTCATCATTG GATGCTTTTA ACTTTCT TGA CATCACTATT GATTCTTGTT CAAAGTACAC 
10930 10940 10950 10 960 10970 10980 10990 



>< XmnI >< Muni 

>< BsmI Fnu4HI > 

>< BscCI BspWI X 

X Maelll X Asp700I X Bbvl Bbvl > 

AGTGGTCACT GTTTTTCTTT GTTTACGAGA ATGCTTTCTT GCCATTT.ACT CTTGGTATTA TGGCAATTGC 
11000 11010 11020 11030 11040 11050 11060 



>< Nspl 

>< NspHI X Tru9I 

>< Nlalll >< Msel >< BsmI 

>< BspWI X Fnu4HI>< BspWI X BscCI . >< Maelll 

TGCATGTGCT ATGCTGCTTG TTAAGCATAA GCACGCA/TTC TTGTGCTTGT TTCTGTTACC TTCTCTTGCA 



11070 



11080 



11090 



II 100 



11110 



11120 



11130 



X BspWI 



>< Tru9I 
>< Msel 



X SfaNI 
x Rraal 

> < Nspl 

> < Nlall I 

X Nhel 
>< Mael 
>< Accl> < NspHI >< Alul 



X MamI 

X HphI 
>< BspHI 
x BsiBI >< Nla-III 

>< BsaBI X Nlalll 



ACAGTTGCTT ACTTTAATAT GGTCTACATG CCTGCTAGCT GGGTGATGCG TATCATGACA TGGCTTGAAT 



11140 11150 11160 11170 

FIGUFLE 13.25 



11180 



11190 



11200 
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>< Tru9I 
>< Msel 

> < Esp4I 
>< Eco57I 

> < Aflll >< Alul 
TGGCTGACAC TAGCTTGTCT GGTTATAGGC TTAAGGATTG TGTTATGTAT GCTTCAGCTT TAGTTTTGCT 

11210 11220 11230 11240 11250 11260 11270 



> < Rnial 

> < Mael 

>< Alul 



> < Nlalll 
>< BspHI >< Alul 



X SfaNI 
>< Bbvl 



>< 



>< Rmal 

>< Mae I I 
>< Mael 
Fnu4HI 

>< AfllH 



TATTCTCATG ACAGC TCGCA CTGTTTATGA TGATGCTGCT AGACGTGTTT GGACACTGAT GAATGTCATT 



11280 



11290 



11300 



11310 



11320 



11330 



11340 



>< Sau3AI 
>< Ndell 
>< Mbol 
>< DpnII 
>< Dpnl 
>< Bspl43I 
>< AccI >< BspAlX Alul 

ACACTTGTTT ACAAAGTCTA CTATGGTAAT GCTTTAGATC AAGCTATTTC CATGTGGGCC TTAGTTATTT 
11350 11360 11370 11380 11390 11400 11410 



>< Sau96I 
>< Pall 
>< NspIV 
>< Nlalll 

>< Haelll 

> < Ddel 
>< Cfrl3I 

X BsuRI 
>< BsiZI 
X BshI 

> < Bfrl 
>< Asul 



>< Rmal 
>< Nlalll 

>< Maelx Sfcl 

>< Maelll x Mnll x Maelll X Alulx Alul 

CTGTAACCTC TAACTATTCT GGTGTCGTTA CGACTATCAT GTTTTTAGCT AGAGCTATAG TGTTTGTGTG 
11420 11430 11440 11450 11460 11470 11480 

Ddel > 

>< BsrI >< Nlalll Bfrl > 

TGTTGAGTAT TACCCATTGT TAT TT ATT AC TGGCAACACC TTACAGTGTA TCATGCTTGT TTATTGTTTC 
11490 11500 11510 11520 11530 11540 11550 

>< Pall 
>< Haelll 
>< Fnu4HI >< BsuRI 
X Bbvl >< Fnu4HI X BspWI 

>< Bbvl x BspWI >< BshI x Eco57I >< Maelll 

TTAGGCTATT GTTGCTGCTG CTACTTTGGC CTTTTCTGTT TACTCAACCG TTACTTCAGG CTTACTCTTG 
11560 11570 11580 11590 11600 11610 11620 



>< Eco3ir 
X BsmAI 
>< Bsal 



X ScrFI 
>< Mval 

X EcoRII 

X Ecll36I 

>< DsaV 

X BstOI 
X BstNI 
X BsiLI 
> < BsaJI 

>< BsaJI 



FIGURE 13.2 6 
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>< DrdI >< Alw26I >< Apyl Ddel >< 

GTGTTTATGA CTACTTGGTC TCTACACAAG AATTTAGGTA TATGAACTCC CAGGGGCTTT TGCCTCCTAA 
11630 11640 11650 11660 11670 11680 11690 



>< Tru9I 
>< Msel 

>< SfaNI > < HindIII> < Tru9I 

>< Mnll >< Alul > < Msel > < Mnll > < Nlalll 

GAGTAGTATT GATGCTTTCA AGCTTAACAT TAAGTTGTTG GGTAT TGGAG GTAAACCATG TATCAAGGTT 
11700 11710 11720 11730 11740 11750 11760 



>< Vnel 
>< Snol 

>< Sdul 
>< NspII 
>< HgiAI 
>< Bspl2863C 
>< Bmyl >< Rsal 

>< Rsal >< ApaLI >< MboII 

>< Csp6I >< Alw4 4I >< Csp6I Ddel > 

>< Afal >< Maell >< Alw21I >< Afal Bfrl > 

GCTACTGTAC AGTCTAAAAT GTCTGACGTA AAGTGCACAT CTGTGGTACT GCTCTCGGTT CTTCAACAAC 
11770 11780 11790 11800 11810 11820 11830 



>< NspII> < Rsal 

>< Drain 
>< SduIX Csp6I 
>< MboII >< Bspl286I 

>< Hinfl >< Plel >< Bcayl > < Afal >< MboII 

TTAGAGTAGA GTCATCTTCT AAATTGTGGG CACAATGTGT ACAACTCCAC AATGATATTC TTCTTGCAAA 
11840 11850 11860 11870 X1880 11890 11900 



>< TthHB8 I 

>< TaqI Sfcl >< 

>< Hindlll X MboII x Nlalll 

X Alul > < Eco57I X BspWI AccI X 

AGACACAACT GAAGCTTTCG AGAAGATGGT TTCTCTTTTG TCTGTTTTGC TATCCATGCA GGGTGCTGTA 
11910 11920 11930 11940 11950 11960 11970 



X Vspl 

X Tru9I > < Ksp632I 

>< Msel X TthHB8 1 > < Earl 

X Asnl X TaqI X MboII > < Eamll04I 

X AselX Mnll X Bcgl/a X Eco57I >< Eco57I >< Bcgl 
GACATTAATA GGTTGTGCGA GGAAATGCTC GATAACCGTG CTACTCTTCA GGCTATTGCT TCAGAATTTA 

11980 11990 12000 12010 X2020 12030 12040 



X StuI 
>< ScrPI 

X Pall 
>< Mvalx Haelll 
>< EcoRIIX Ecol47I 

>< Ecll36I 
>< DsaV x BsuRI 
>< BstOI 
>< BstNI 

X BspWI 
X BsiLI 

X Fnu4HI >< BsaJI >< BshI Tfil X 

X Ndel X BspWIX Mnll X Bgll >< Sfcl Hinfl X 

>< Acil x Apylx AatI > < Alul 
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GTTCTTTACC ATCATATGCC GCTTATGCCA CTGCCCAGGA GGCCTATGAG CAGGCTGTAG CTAATGGTGA 
12050 12060 12070 12080 12090 12100 12110 

>< XranI >< Tru9I >< SfaNI 

>< HphI >< Msel >< Ddel 

>< Asp700I >< Eco57I >< Bbvl Fnu4HI >< 

TTCTGAAGTC GTTCTCAAAA AGTTAAAGAA ATCTTTGAAT GTGGCTAAAT CTGAGTTTGA CCGTGATGCT 

12120 12130 12140 12150 12160 12170 12180 

XhoII >< 
Sau3AI >< 
Ndell >< 

Mnll > 
>< Mnll 
>< Mfll 

> < Sau3AI >< Mbol 

> < Ndell Dpnll >< 

> < Mbol Dpnl >< 

> < Dpnl I Ddel >< 

>< Dpnl BstYI X 

>< BspWI >< RsalBspAI >< 

> < BspAI >< Csp6IBspl43I >< 
>< Nlalll >< Bspl43I >< AfalBglll >< 

GCCATGCAAC GCAAGTTGGA AAAGATGGCA GATCAGGCTA TGACCCAAAT GTACAAACAG GCAAGATCTG 
12190 12200 12210 12220 12230 12240 12250 

>< Spel >< Ksp632I > < Hindlll 

>< Rmal >< Ddel >< SfaNI 

>< Maelll >< MboII >< Eamll04I >< BspWI 

>< Mael >< BspWI >< Earix Bfrl >< Alul 

AGGACAAGAG GGCAAAAGTA ACTAGTGCTA TGCAAACAAT GCTCTTCACT ATGCTTAGGA AGCTTGATAA 
12260 12270 12280 12290 12300 12310 12320 

>< Thai 

>< Mvnl 
>< HinPlI 
>< Hin6I 

>< Hhal 

>< Cfol 

>< BstUI 

>< Tru9I >< BspSOI 

>< Msel >< AccII Sfcl >< 

TGATGCACTT AACAACATTA TCAACAATGC GCGTGATGGT TGTGTTCCAC T C AAC AT CAT ACCATTGACT 
12330 12340 12350 12360 12370 12380 12390 

>< Rsal 
>< NlalV 
>< Eco64I 
>< Csp6I 
>< BslI 

>< BsiYlX Kpnl 
>< BscBI 
>< BanI 
>< Asp718 

>< Nlalll >< Afal 

>< BstXI >< AccBlI >< Maelll 

>< Fnu4HI >< Bbvl >< Acc65I Bsgl >< 

ACAGCAGCCA AACTCATGGT TGTTGTCCCT GATTATGGTA CCTACAAGAA CACTTGTGAT GGTAACACCT 
12400 12410 12420 12430 12440 12450 12460 

>< Zsp2I 
>< PpulOI 
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>< Nsil 

>< Mphll03I 

>< NdelX EcoT22I Ddel >< 

>< Avalll >< SfaNI >< SfaNI X Acil Bfrl >< 

TTACATATGC ATCTGCACTC TGGGAAATCC AGCAAGTTGT TGATGCGGAT AGCAAGATTG TTCAACTTAG 
12470 12480 12490 12500 12510 12520 12530 

>< Pall 

>< Haelll >< Mnll >< DdelDdel >< 
>< Tru9I>< Nlalll >< BsuRI >< Maelll >< BspWI 

>< Mseix HphI > < XcmlX BshI >< Alul BspWI >< 

TGAAATTAAC ATGGACAATT CACCAAATTT GGCTTGGCCT CTTATTGTTA CAGCTCTAAG AGCCAACTCA 
12540 12550 12560 12570 12580 12590 12600 

Rsal >< 
NlalV >< 
Kpnl x 
>< Fnu4HI 
Eco64I >< 
Csp6I >< 

>< Tru9I BscBI >< 

>< PvuII Asp718 >< 

>< Psp5I Afal >< 

>< NspBII >< AcilX BanI 

>< Msel >< Hinfl >< Plel AccBlI X 

>< Alul > < Sfcl >< Ddeix BsrI >< PshAI Acc65I X 

GCTGTTAAAC TACAGAATAA TGAACTGAGT CCAGTAGCAC TACGACAGAT GTCCTGTGCG GCTGGTACCA 
12610 12620 12630 12640 12650 12660 12670 

>< TthHB8I 
>< TaqI 
X Sful 
X NspV 
>< Mnll 
>< Lspl 
>< Csp45I 
X BstBI 

>< Rsal X Bspll9I 

X Csp6I X BsiCI 

X Alul X Bpul4I 

>< Afal X AsuII 

C AC AAAC AG C TTGTACTGAT GACAATGCAC TTGCCTACTA TAACAATTCG AAGGGAGGTA GGTTTGTGCT 
12680 12690 12700 12710 12720 12730 12740 

>< XhoII 
X Sau3AI 
X Ndell 
>< Mfll 
X Mbol 
X DpnII 
>< Dpnl 

X BstYI >< Tfil X Rsal 

X BspAI x Rmal >< Csp6I 

X Bspl4 3I >< Hinfl X Csp6I>< Rsal 

x Bglll x Mael >< Ddel >< Afaix Afal 

GGCATTACTA TCAGACCACC AAGATCTCAA ATGGGCTAGA TTCCCTAAGA GTGATGGTAC AGGTACAATT 
12750 12760 12770 12780 12790 12800 12810 

>< Sau96I 

>< PssI 
x Pall 
>< NspIV 

FIGURE 13.29 
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>< Haelll 
X EcoOL09I 
>< Drair 
>< Cfrl3I 

>< BsuRI 

>< NlalV >< BsiZL Rsal > 

>< BsrI >< BshI Csp6I >< 

>< BscBI > < Maelll >< Asul Afal > 

TACACAGAAC TGGAACCACC TTGTAGGTTT G T T AC AG AC A CACCAAAAGG GCCTAAAGTG AAATACTTGT 
12820 12830 12840 12850 12860 12870 12880 

>< Sfcl 

> < MboII 
Maell >< 
>< Fnu4HI >< Rsal 
>< Eco57I >< Csp6I 
>< Tru9r > < Bbsl 

>< Msel >< Mnll >< Bbvl >< Alul >< Afal 

ACTTCATCAA AGGCTTAAAC AACCTAAATA GAGGTATGGT GCTGGGCAGT TTAGCTGCTA CAGTACGTCT 
12890 12900 12910 12920 12930 12940 12950 

>< Rsal 
>< Sfcl >< Csp6I 
>< BspWI >< Afal >< BspMI AccI >< 

TCAGGCTGGA AATGCTACAG AAGTACCTGC CAATTCAACT GTGCTTTCCT TCTGTGCTTT TGCAGTAGAC 
12960 12970 12980 12990 13000 13010 13020 

>< Rmal 

>< Mnll 
>< Mael >< HphI 

CCTGCTAAAG CATATAAGGA TTACCTAGCA AGTGGAGGAC AACCAATCAC CAACT GTGTG AAGATGTTGT 
13030 13040 13050 13060 13070 13080 13090 

>< SinI 
>< Sau96I 
>< NspIV 

>< NspHII 
>< Nlalll 
>< Eco47I 

>< EamllOSI 
>< Cfrl3I 

>< Rsal >< Rsal >< BsiZI 

>< MboII >< Csp6I >< Bmel8I >< Xcml 

>< Csp6I >< BsrI >< Avail Plel >< 

>< Afal >< Afal >< Maelll >< Alul >< Asul> < Hinfl 

GT AC AC AC AC TGGTACAGGA CAGGCAATTA CTGTAACACC AGAAGCTAAC ATGGACCAAG AGTCCTTTGG 
13100 13110 13120 13130 13140 13150 13160 

>< Tfil 

>< SfaNI >< Maelll 

>< Nlalll >< Fokl >< Hinfl 

TGGTGCTTCA TGTTGTCTGT ATTGTAGATG CCACATTGAC CATCCAAATC CTAAAGGATT CTGTGACTTG 
13170 13180 13190 13200 13210 13220 13230 

> < Rsal 
>< Maell 

>< Csp6I >< Ddel 

> < Afal >< BsrI >< Bfrl 
AAAGGTAAGT ACGTCCAAAT ACCTACCACT TGTGCTAATG ACCCAGTGGG TTTTACACTT AGAAACACAG 

13240 13250 13260 13270 13280 13290 13300 

>< Thai 
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>< SfaNI 
>< Mvnl 
>< BstUI 

>< Rsal >< BspSOI 

>< Csp6I >< Acil 

>< Afal >< AciT >< Sfcl >< Maelll >< AccIISfaNI >< 

TCTGTACCGT CTGCGGAATG TGGAAAGGTT ATGGCTGTAG TTGTGACCAA CTCCGCGAAC CCTTGATGCA 
13310 13320 13330 13340 13350 13360 13370 



>< Zsp2I 

> < SfaNI 
>< Mphll03l>< Tru9I 

X PpulOix Maell Fnu4HI >< 

>< Nsil> < Fokl Bsgl >< 

>< EcoT22I >< Msel >< Bbvl 

>< Acilx Avalll >< Oral >< Acil >< Fnu4HI Acil >< 
GTCTGCGGAT GCATCAACGT TTTTAAACGG GTTTGCGGTG TAAGTGCAGC CCGTCTTACA CCGTGCGGCA 

13380 13390 13400 13410 13420 13430 13440 



>< Spel 

>< Seal 

X Rsal 
>< Rmal 
x Mael 

> < Csp6I X Sfcl >< BspWI 

x'BspWI >< Afal >< AccI >< Bcgl/a Bcgl > 

CAGGCACTAG TACTGATGTC GTCTACAGGG CTTTTGATAT TTACAACGAA AAAGTTGCTG GTTTTGCAAA 
13450 13460 13470 13480 13490 13500 13510 



X ScrFI 
X Mval 

X Mnll 
X EcoRII 
X EC1136I 
X BstOI 
X BstNI 

X BslI 
X DsaV x BsiYI 

X BsiLI >< Plel 

X Apyl > < Fokl X Hinfl 

GTTCCTAAAA ACTAATTGCT GTCGCTTCCA GGAGAAGGAT GAGGAAGGCA ATTTATTAGA CTCTTACTTT 
13520 13530 13540 13550 13560 13570 13580 



X Nlalll 
X Ksp632I 
>< Earl 

>< Tru9I >< Eamll04I 

X Msel >< BsinAI X Tru9I 

X Mnll X Alw26I >< MboII >< Msel 

GTAGTTAAGA GGCATACTAT GTCTAACTAC CAACATGAAG AGACTATTTA TAACTTGGTT AAAGATTGTC 
13590 13600 13610 13620 13630 13640 13650 

x Rsal 
>< NlalV 

> < Nlalll 

X Kpnl 
>< HphI 

> < Eco64I 
X Csp6I 

X BscBI 

> < Banl 

> < Asp718 
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>< Maelll >< Afar 

>< NspBII > < AccBlI Mae II >< 

>< Acil >< Nlalll > < Acc65l > < Hgal 

CAGCGGTTGC TGTCCATGAC TTTTTCAAGT TTAGAGTAGA TGGTGACATG GTACCACPlTA TATCACGTCA 

L3660 13670 13680 13690 13700 137 10 13720 



>< Mnll 
>< Mae I I 

GCGTCTAACT aaatacacaa tggctgattt agtctatgct ctacgtcatt ttgatgaggg taattgtgat 

13730 13740 13750 13760 13770 13780 13790 

>< Tru9I 

>< Msel >< Maelll >< Muni 

acattaaaag aaatactcgt cacatacaat tgctgtgatg atgattattt caataagaag gattggtatg 



13800 



13810 



13820 



13830 



13840 



13850 



13860 



>< Thai 
>< Mvnl 
>< Mlul 
>< BstUI 
>< Bsp50I 

>< Tfil >< AflHI >< Ddel 

>< Hinfl >< AccII >< BfrrI 

ACTTCGTAGA GAATCCTGAC ATCTTACGCG TATATGCTAA CTTAGGTGAG CGTGTACGCC AATCATTATT 
13870 13880 13890 13900 13910 13920 13930 



>< Rsal 
>< HphI 
>< Csp6I Tru9I >< 
>< Afal Msel >< 



> < SfaNI 
>< Rsal 
>< Csp6I 
>< Afal 



>< 



>< SfaNI 



>< Rsal 
> < Csp6I 
BspWI 

>< Afal 



XhoII 
Sau3AI 
Ndell 
Mfll 
Mb ol 
DpnII 
BstYI 
BspAI 



AAAGACTGTA CAATTCTGCG ATGCTATGCG TGATGCAGGC ATTGTAGGCG TACTGACATT AGATAATCAG 



13940 



13950 



13960 



13970 



13980 



13990 



14000 



>< Tru9I 
>< Msel 
>< Dpnl 
>< Bspl43I 

>< Alwl 



>< Rsal 
>< Csp6I 
>< BsrI 
>< Afal 



>< Rsal 

> < HphI 
>< Csp6I 

> < Bbvl 
>< Afal 



> 
> 



< ScrFI 

< Mval 

>< Fnu4HI 
X EcoRII 

> < EC1136X 
BstOI 
BstNI 

X BslI 
X BsiYI 
BsiLI 
Apyl 



< 
< 



< 
< 



X DsaV >< A>cil 



GATCTTAATG GGAACTGGTA CGATTTCGGT GATTTCGTAC AAGTAGCACC AGGCTGCGGA GTTCCTATTG 
14010 14020 14030 14040 14050 140SO 14070 



>< Tfil 
X Hinfl 



>< SfaNI 
X Fokl 



>< MamI 
>< BsiBI 
>< BsaBI 



x Rmal 
>< Mnll 
>< Mael 
>< Bbvl 



X SfaNI 
> < Hinfl 
>< Fnu4HIPleI x 
>< Ddel 
X BspWI Ndel X 



TGGATTCATA T TACT CAT TG CTGATGCCCA TCCTCACTTT GACTAGGGCA TTGGCTGCTG AGTCCCATAT 
14080 14090 14100 14110 14120 14130 14140 



X Sau3AI 
x Ndel I 
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>< Mbol 
>< Maral 

X Dpnll Tthllll >< 

>< Dpnl MboII >< 

X BspWI >< Ksp632I 

X BspAI >< Earn! 10 4 I 

>< Bspl4 3I X Xcml >< BsmAI 

X BsiBI X Tru9I >< Earl Aspl X 

>< BsaBI X Fokl x Msel >< Alw26I 
GGATGCTGAT CTCGCAAAAC CACTTATTAA GTGGGATTTG CTGAAATATG ATTTTACGGA AG AG AG ACTT 

14150 14160 14170 14180 14190 14200 14210 

> < SinI 

> < Sau96I 

> < NspIV 
X NspHII 

>< TthHB8I >< NlalV 

>< TaqI >< Fokl 

>< Mcrl > < Eco47l 

> < Ksp632I > < Cfrl3I 

> < Earl > < BsiZI 

> < Eamll04I x Ssplx BscBI 
>< BsmAI > < Tru9I > < Bmel8I 

X Mboir X BsiEI> < Msel > < Avail >< Tru9I 

X Alw26I >< Oral > < Asul >< Muni >< Msel 

TGTCTCTTCG ACCGTTATTT TAAATATTGG GACCAGACAT ACCATCCCAA TTGTATTAAC TGTTTGGATG 
14220 14230 14240 14250 14260 14270 14280 

SinI >< 
Sau96I X 
NspIV X 
NspHII > 
Eco47I X 
Cfrl3I x 
BsiZI X 
Bmel8I >< 

X Tru9I Avail >< 

x Fokl X Msel Asul X 

ATAGGTGTAT CCTTCATTGT GCAAACTTTA ATGTGTTATT TTCTACTGTG TTTCCACCTA CAAGTTTTGG 
14290 14300 14310 14320 14330 14340 14350 

X Spel 
x Rraal 

X Mael x Sspl >< BsrI 

ACCACTAGTA AGAAAAATAT TTGTAGATGG TGTTCCTTTT GTTGTTTCAA CTGGATACCA TTTTCGTGAG 
14360 14370 14380 14390 14400 14410 14420 

>< ThalX Esp3I 

X Ddel 
X BstUI 

X Rsal >< BspSOI >< BsmBI 

X Hinfl >< Plel x MvnIX BsmAI 

> < Csp6I >< HgalX Alul X Alw26I 

X Afal X Fokl >< AccII > < Bbvl 

TTAGGAGTCG TACATAATCA GGATGTAAAC TTACATAGCT CGCGTCTCAG TTTCAAGGAA CTTTTAGTGT 
14430 14440 14450 14460 14470 14480 14490 

X Zsp2I 
>< SphI 
>< PpulOI 

>< Pael 
>< Nspl 
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>< Sau3AI 
>< Ndell 
>< Mbol 
>< DpnII 

> < Dpnl 
>< Fnu4HIX BspWI 

>< BspAI 

> < Bspl43I> < 
>< Alwl >< Alul 



>< NspHI 
>< Nsil 

X Nlalll 
>< Mphll03I 

>< Fnu4HI 
>< EcoT22I 
>< BspWI 

Aval II > < AlwNI 

>< Alul >< Bbvl 



>< 
>< 



Rmal 
Mae I 



NspHI 
Nlalll 

X 

>< 
>< 



>< Nspl 

>< 

>< 

Bspwr 

Bsgl 
Bbvr 



ATGCTGCTGA TCCAGCTATG CATGCAGCTT CTGGCAATTT ATTGCTAGAT AAACG C ACT A CATGCTTTTC 



14500 



14510 



14520 



14530 



14540 



14550 



14560 



>< ScrFI 
>< Neil 
>< Mspl 
X Hpall 

>< Fnu4HI >< HapII 

>< AlwNI X DsaV >< Tru9I 

>< Alul >< Bcnl >< Msel 

AGTAGCTGCA CTAACAAACA ATGTTGCTTT TCAAACTGTC AAACCCGGTA ATTTTAATAA AGACTTTTAT 
14570 14580 14590 14600 14610 14620 14630 

>< Tru9I Ddel >< 

>< Msel X MboII Bbvl >< 

GACTTTGCTG TGTCTAAAGG TTTCTTTAAG GAAGGAAGTT CTGTTGAACT AAAACACTTC TTCTTTGCTC 
14640 14650 14660 14670 14680 14690 147 00 

>< Fokl EcoRV X 

x Fnu4HI Eco32I x 

AGGATGGCAA CGCTGCTATC AGTGATTATG ACT ATT AT CG TTATAATCTG CCAACAATGT GTGATATCAG 

14710 14720 14730 14740 14750 14760 14770 

>< VspT 
>< Tru9I 
>< Msel 
X Asal 

>< Maelll X Asel 

ACAACTCCTA TTCGTAGTTG AAGTTGTTGA TAAATACTTT GATTGTTACG ATGGTGGCTG TATTAATGCC 
14780 14790 14800 14810 14820 14830 14840 



X Tru9I 

X Msel 
x Hpal 
X Hindll 
X Hindi 



X Pvull 
X Psp5I 
X NspBII 
X Alul 



> < Xcml 
>< Tru9I Rmal X 

>< Msel Mael x 



AACCAAGTAA TCGTTAACAA TCTGGATAAA TCAGCTGGTT TCCCATTTAA TAAATGGGGT AAGGCTAGAC 



14850 



14860 



14870 



14880 



14890 



14900 



14910 



>< SfaNI 

X Sau3AI 
X Ndell 
X Mbol 

x DpnII X 
X Dpnl 

X Plel X Bspl43I 

X HinfIX Mnll X BspAI X Alwl 
TTTATTATGA CTCAATGAGT TATGAGGATC AAGATGCACT TTTCGCGTAT ACTAAGCGTA AT GT CATC C C 
14920 14930 14940 14950 14960 14970 14980 



X Thai 
>< Mvnl 
X BstUI 

X Bstll07I 
BspWI X Fokl 
>< BspSOl 
>< Accllx Ddel 
X AccI 



X SstI 
X Sdul 
X SacI 
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>< Tru9I 
>< Tfil 

>< Msel 
X Hinfl 

> < Esp4I 

> < Aflll X BspWI > < Alul >< Alul 
TACTATAACT CAAATGAATC TTAAGTATGC CATTAGTGCA AAGAATAGAG CTCGCACCGT AGCTGGTGTC 

14990 15000 15010 15020 15030 15040 15050 



>< NspII 
>< HgiAI 
>< Eco24I 
< EC1136II 
>< Bspl286I 
>< Brayl 
>< Banll 
>< Alw21I 



>< Seal 
>< Sfclx Rsal 
>< BsmAI >< Csp6I 
>< Alw26I >< Afal 



Rmal x 
> < Mnll 

Mae I >< 
>< Fnu4HI 
>< Acil 



TCTATCTGTA G T ACT ATG AC AAATAGACAG T T T CAT C AG A AATTATTGAA GTCAATAGCC GCCACTAGAG 
15060 15070 15080 15090 15100 15110 15120 



>< Tru9I 

>< Alul >< Msel 

GAGCTACTGT GGTAATTGGA ACAAGCAAGT TTTACGGTGG CTGGCATAAT ATGTTAAAAA CTGTTTACAG 
15130 15140 15150 15160 15170 15180 15190 

Nspl >< 
NspHI >< 
Nlalll >< 
>< Nlalll 

Ddel X 
BspWI >< 
>< Maelll Bfrl X 

TGATGTAGAA ACTCCACACC TTATGGGTTG GGATTATCCA AAATGTGACA GAGCCATGCC TAACATGCTT 
15200 15210 15220 15230 15240 15250 15260 



> < Pall 

> < Haelll 

> < BsuRI 

> < BshI X Mnll X Maelll Sfcl >< 
AGGATAATGG CCTCTCTTGT TCTTGCTCGC AAACATAACA CTTGCTGTAA CTTATCACAC CGTTTCTACA 



15270 



15280 



15290 



15300 



15310 



15320 



15330 



X MstI 
>< HinPlI 
>< Hin6I 

> < Hhal 
X Fspl 

>< Fdill >< Nlalll 

> < Cfoix Tru9I > < Fnu4HI 
X Alul X Avill >< Msel X Acil 

GGTTAGCTAA CGAGTGTGCG CAAGTATTAA GTGAGATGGT CATGTGTGGC GGCTCACTAT ATGTTAAACC 
15340 15350 15360 15370 15380 15390 15400 



Tru9I X 

ScrFI > 
Mval > 
>< Msel 
Fokl x 
EcoRII x 
Ecll36I > 
DsaV X 
BstOI > 
BstNI > 
BsiLI > 
Apyl > 



> < SfaNI 

X Mspl 
X Hpall 
X HapII 



X HphI 
>< BspWI 



x Tru9I 
x Msel 



Maelll X 
Alul x 



FIGURE 13.35 



WO 2005/056781 



49/116 



PCT/FR2004/003105 



AGGTGGAACA TCATCCGGTG ATGCTACAAC TGCTTATGCT AATAGTGTCT TTAACATTTG TCAAGCTGTT 
15410 15420 15430 15440 15450 15460 15470 

>< DrdI 

>< Bs P wr >< Alur > <AciI 

ACAGCCAATG TAAATGCACT TCTTTCAACT GATGGTAATA AGATAGCTGA CAAGTATGTC CGCAATCTAC 
15480 15490 15500 15510 15520 15530 15540 

>< Sau3AI 
>< Ndell 
>< Mbol 
> < MamI 

>< Fbal 
>< DpnII 

>< Dpnl 
X BspHI 
X BspAI 

>< Bspl43I 
>< BsiQI 

>< Sfcl > < BsiBlX Nlalll 

>< BsmAI > < BsaBIx Fokl 

>< Alw26I >< BcllX EcoRI Fokl >< 

AACACAGGCT CTATGAGTGT CTCTATAGAA ATAGGGATGT TGATCATGAA TTCGTGGATG AGTTTTACGC 
15550 15560 15570 15580 15590 15600 15610 

>< Tfil 

>< SfaNI 
>< Nlalll 

>< BspMI >< Hinfl >< Maelll 

TTACCTGCGT AAACATTTCT CCATGATGAT TCTTTCTGAT GATGCCGTTG TGTGCTATAA CAGTAACTAT 
15620 15630 15640 15650 15660 15670 15680 

> < Rmal 
>< Nhel >< Tru9I 
>< Fnu4HI > < Mael x Tru9I 

>< Acil >< Alul >< Msel x Msel Mnll X 

GCGGCTCAAG GTTTAGTAGC TAGCATTAAG AACTTTAAGG CAGTTCTTTA TTATCAAAAT AATGTGTTCA 
15690 15700 15710 15720 15730 15740 15750 

X SinI 
X Sau96I 

>< PssI 
x Psp5II 
X PpuMI 
X NspIV 

X NspHII 
>< EcoO109I 
>< Eco47I 
X Drall 
X Cfrl3I 
X BsiZI 
>< Dele I >< Bmel8I 

>< Nlalll >< BsmAI >< Avail 

X Ddel x Alw26I >< A sul >< Mnll 

TGTCTGAGGC AAAATGTTGG ACTGAGACTG ACCTTACTAA AGGACCTCAC GAATTTTGCT CACAGCATAC 
15760 15770 15780 15790 15800 15810 15820 

>< XhoII 
>< Sau3AI 
>< Ndell 
>< Mfll 
>< Mbol 

FIGURE 13. 3 6 
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>< Rsal >< DpnII 

>< Maell >< Dpnl > < Sspl 

>< Tru91 >< Csp6I >< BstYI HinPlI X 

>< >< BsaAI >< BspMI Hin6I >< 

>< Ma ^r >< Afirn >< bspai Hhar >< 

>< BspWlX Msel >< Afal >< AlwlX Bspl43I Cfol X 

AATGCTAGTT AAACAAGGAG ATGATTACGT GTACCTGCCT TACCCAGATC CATCAAGAAT ATTAGGCGCA 
15830 15840 15850 15860 15870 15880 15890 

>< Rsal >< sfaNX 

>< TthHB8I >< Csp6I >< Maelll 

>< Ta ql X Afal BsrI X 

GGCTGTTTTG TCGATGATAT TGTCAAAACA GATGGTACAC TTATGATTGA AAGGTTCGTG TCACTGGCTA 
15900 15910 15920 15930 15940 15950 15960 

> < Fokl 
X BspWI 

TTGATGCTTA CCCACTTACA AAACATCCTA ATCAGGAGTA TGCTGATGTC TTTCACTTGT ATTTACAATA 
15970 15980 15990 16000 16010 16020 16030 

X Van91I 
>< PflMI 
>< Nspl 

> < Pallx NspHI 

> < MscIX Nlalll 

> < Haelll 

> < BsuRI 
X BsrI 

>< Eael >< BslI x Nspl 

> < BshlX BsiYI X NspHI 
X Nlalll >< AflHI X AflHI 

>< Maelll >< Alul > < Ballx AccB7I >< Nlalll 

CATTAGAAAG TTACATGATG AGCTTACTGG CCACATGTTG GACATGTATT CCGTAATGCT AACTAATGAT 
16040 16050 16060 16070 16080 16090 16100 

x Rsal> < NlalV 
>< Mnll 

>< Csp6I >< Ddel >< Rsal 

>< BsrI X Mnll >< Csp6I 

>< Afal> < BscBI >< Afal Sfcl x 

AACACCTCAC GGTACTGGGA ACCTGAGTTT TATGAGGCTA TGTACACACC ACATACAGTC TTGCAGGCTG 

16110 16120 16130 16140 16150 16160 16170 

X NlalV 

X EcoNI 
>< Eco31I 
X Eco64I>< BsmAI 

>< BscBI X BslI 
X BanI X BsiYI 
>< Acil X Bsal 

X BspWI >< AccBllX Alw26I Bbvl >< 

TAGGTGCTTG TGTATTGTGC AATTCACAGA CTTCACTTCG TTGCGGTGCC TGTATTAGGA GACCATTCCT 
16180 16190 16200 16210 16220 16230 16240 

>< Tthllll 

>< Fnu4HI X Nlalll > < Tru9l 

X BspWI X Aspl > < MseI 

ATGTTGCAAG TGCTGCTATG ACCATGTCAT TTCAACATCA CACAAATTAG TGTTGTCTGT TAATCCCTAT 
16250 16260 16270 16280 16290 16300 16310 

x ScrFI 
x Mval 

FIGURE 13.3 7 
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51/H6 

>< ecorii 

>< Ecll36I 
>< DsaV 
>< BstOI 
>< BstNI 

>< BsiLI >< Bmal 

X BsaJI >< Mnll BspWI >< 

>< Apyl >< Maelll >< Maelll >< Mael >< AIuI 

GTTTGCAATG CCCCAGGTTG TGATGTCACT GATGTGACAC AACTGTATCT AGGAGGTATG AGCTATTATT 
16320 16330 16340 16350 16360 16370 16380 

>< Maelll >< Mnll 

GCAAGTCACA TAAGCCTCCC ATTAGTTTTC CATTATGTGC TAATGGTCAG GTTTTTGGTT TATACAAAAA 
16390 16400 16410 16420 16430 16440 16450 

>< Nspl >< NspI 

>< NspHI > < Tthllll >< NspHI 

>< Nlalllx Maellix Maelll >< Nlalll 

X Afllll >< Aspl >< Afllll 

CACATGTGTA GGCAGTGACA ATGTCACTGA CTTCAATGCG ATAGCAACAT GTGATTGGAC TAATGCTGGC 
16460 16470 16480 16490 16500 16510 16520 

>< Rsal 
X Plel 
X Ddel 
>< Csp6I 

X BsmAI X Hinfl >< Mnll 

>< Alw26I >< Hindlll Ddel X 

>< Afal >< Alul X Fnu4HI X Bbvl 

GAT T AC AT AC TTGCCAACAC TTGTACTGAG AGACTCAAGC TTTTCGCAGC AGAAACGCTC AAAGCCACTG 
16530 16540 16550 16560 16570 16580 16590 

> < Thai 

>< Seal 
>< Rsal >< Rsal 

> < Mvnl 

>< Csp6I X Csp6I 

> < BstUI 

> < Tru9I > < Bsp50I 

> < Msel > < Ndel >< Afal x Afal 

x Alul > < AccII Mnll > 

AGGAAACATT TAAGCTGTCA TATGGTATTG CCACTGTACG CGAAGTACTC TCTGACAGAG AATTGCATCT 
16600 16610 16620 16630 16640 16650 16660 

Maelll X 
X Maelll 
X Ecc-0651 
X Eco91I 
>< BstPI 

X SfaNI >< Rmal >< BstEII 

>< Nlalll >< Mael >< B srl 

TTCAT GGGAG GTTGGAAAAC CTAGACCACC ATTGAACAGA AACTATGTCT TTACTGGTTA CCGTGTAACT 
16670 16680 16690 16700 16710 16720 16730 

Rsal X 
>< Mnll 

x Rsal >< Rsal >< H phl 

>< Csp6I >< Csp6I >< SfaNI Csp6l >< 

>< Afal . >< Afal >< Maelll >< Hphl Afal x 

AAAAATAGTA AAGTACAGAT TGGAGAGTAC ACCTTTGAAA AAGGTGACTA TGGTGATGCT GTTGTGTACA 
16740 16750 16760 16770 16780 16790 16800 



FIGURE 13. 38 



WO 2005/056781 



52/116 



PCT/FR2004/003105 



>< Rsal >< HphI 

>< Csp6I >< Hindll Ddel >< 

>< Afal >< Hindi Bfrl >< 

GAGGTACTAC GACATACAAG TTGAATGTTG GTGATTACTT TGTGTTGACA TCTCACACTG TAATGCCACT 

16810 16820 16830 16840 16850 16860 16870 

>< Vnel 
>< Snol 

>< Sdul 

>< NspII 

>< HgiAI > < Sdul 

>< Drain > < NspII 

>< Bspl286I > < HgiAI 

>< Bmyl >< BspWI >< Oral II >< Rsal 

>< ApaLI >< Rmal > < Bspl286I X Csp6I 

>< Alw44I >< Mael > < Bmyl >< BsrI 

>< Alw21I > < Alw21I >< Afal Ddel > 
TAGTGCACCT ACTCTAGTGC CACAAGAGCA CTATGTGAGA ATTACTGGCT TGTACCCAAC ACTCAACATC 

16880 16890 16900 16910 16920 16930 16940 

Styl >< 

SinI > 
Sau96I > 
NspIV > 
EcoT14I >< 

Eco4 7I > 
Ecol30I >< 
>< Seal Cfrl3l > 
BssTlI >< 
>< SphI >< Rsal BsiZI > 
>< Pael BsaJI >< 

X Nlalll Bmel8I > 

>< Rmal >< Nsplx Csp6I Avail > 

>< Mael >< NspHIX Afal Asul > 

TCAGATGAGT TTTCTAGCAA TGTTGCAAAT TATCAAAAGG TCGGCATGCA AAAGTACTCT ACACTCCAAG 
16950 16960 16970 16980 16990 17000 17010 

>< ScrFI 

>< Rsal 
>< Mval 
>< EcoRII 
>< Ecll36I 

> < Csp6I 
>< BstOI 
>< BstNI 
>< Xcml >< BslI 
>< NspHII >< BsiYI 
X BsiLI 

X Apyl >< BsrI 
>< DsaVX Afal > < Hinflx Plel 
GACCACCTGG TACTGGTAAG AGTCATTTTG CCATCGGACT TGCTCTCTAT TACCCATCTG CTCGCATAGT 
17020 17030 17040 17050 * 17060 17070 17080 

>< SfaNI 

X SphI x PvuII 

x Pael x PspSI 

>< Nspl X NspBII 

X NspHI X Fnu4HI > < Tru9I 

X Bstll07I > < NlalllX BspWI >< Sspl 

X AccI X Nlalll X Alul X Bbvl > < Msel 

GTATACGGCA TGCTCTCATG CAGCTGTTGA TGCCCTATGT GAAAAGGCAT TAAAATATTT GCCCATAGAT 

17090 17100 17110 17120 17130 17140 L7150 

FIGURE 13.39 
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>< 



>< 



> 

Thai 
> 

Mvnl 
> 

X 



< Thai 

< Mvnl 
>< Thai 

< HinPlI 
HinPlI 



>< HinPlI >< Mvnl 

> < Hin6I 
>< Hin6I 

> < Hhal 
>< Hhal >< Hhal 

> < Cfol 
>< Cfol >< Cfol 

> < BstUI 
X BstUI >< BstUI 

>< BssHII 
>< BspMI 

> < BspSOI 

>< BspSOIX BspSOI Rmal > 

>< Tfil >< Hin6I> < AccII Mael > 

>< Hinfl >< AccII >< AccII > < EcoRI 

AAATGTAGTA GAATCATACC TGCGCGTGCG CGCGTAGAGT GTTTTGATAA ATTCAAAGTG AATTCAACAC 
L7160 17170 17180 17190 17200 17210 17220 

X Zsp2I 
X PpulOI 

>< Nsil 

X Mphll03I 

>< EcoT22I 

X Bsgl > < Avalll X DrdI 

TAGAACAGTA TGTTTTCTGC ACTGTAAATG CATTGCCAGA AACAACTGCT GACATTGTAG TCTTTGATGA 
17230 17240 17250 17260 17270 17280 17290 

X Rmal 

X Mael >< Maell 

AATCTCTATG GCTACTAATT ATGACTTGAG TGTTGTCAAT GCTAGACTTC GTGCAAAACA CTACGTCTAT 
17300 17310 17320 17330 17340 17350 17360 



X Sau3AI 
>< Ndell 
X Mbol 
X DpnII 
X Dpnl 

X BspAI >< Rmal 

X Alwix Bspl43I > < Acil X Mael Sspl X 

ATTGGCGATC CTGCTCAATT ACCAGCCCCC CGCACATTGC TGACTAAAGG CACACTAGAA CCAGAATATT 



17370 



17380 



17390 



17400 



17410 



17420 



17430 



X SinI 
>< Sau96I 

>< NspIV x Styl 

X NspHII X Nspl 

X Eco47l X NspHI 

X Cfrl3l >< Nlalll 

X BsiZI >< EcoT14I 

>< Bsgl X Ecol30I 

X Bmel8I X BssTlI 

>< Tru9I >< Avail x BsaJI 

>< Msel X Asul> < Afllll 

TTAATTCAGT GTGCAGACTT ATGAAAACAA TAGGTCCAGA CATGTTCCTT GGAACTTGTC GCCGTTGTCC 

17440 17450 17460 17470 17480 17490 17500 
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>< Hindll 

>< Hindi >< AluT 

TGCTGAAATT GTTGACACTG TGAGTGCTTT AGTTTATGAC AATAAGCTAA AAGCACACAA GGATAAGTCA 

17510 17520 17530 17540 17550 17560 17570 

>< Ai "I >< Nlalll 

GCTCAATGCT TCAAAATGTT CTACAAAGGT GTTATTACAC ATGATGTTTC ATCTGCAATC AACAGACCTC 
17580 17590 17600 17610 17620 17630 17640 

>< Mnll 
>< EcoNI 

>K Bsl1 >< HphI 

>< BsiYI >< AluI 

AAATAGGCGT TGTAAGAGAA TTTCTTACAC GCAATCCTGC TTGGAGAAAA GCTGTTTTTA TCTCACCTTA 
17650 17660 17670 17680 17690 17700 17710 

>< Sfcl >< Ddel >< Tfil 

> < AluI >< Bfrl >< Hinfl 

TAATTCACAG AACGCTGTAG CTTCAAAAAT CTTAGGATTG CCTACGCAGA CTGTTGATTC ATCACAGGGT 
17720 17730 17740 17750 17760 17770 17780 

> < Hindll 

>< TthlUI > < Hindi 

X Aspl >< AciI 

TCTGAATATG ACTATGTCAT ATTCACACAA ACTACTGAAA CAGCACACTC TTGTAATGTC AACCGCTTCA 
17790 17800 17810 17820 17830 17840 17850 



X Xholl 
>< Sau3AI 
>< Ndell 
>< Mfll 
X Mbol 
X Maral 
>< DpnII 

x Dpnl 
>< BstYI 
X BspAI 

>< Bspl43I 
>< BsiBI 
>< BsaBI 
X BspWI >< Bglll 

ATGTGGCTAT CACAAGGGCA AAAATTGGCA TTTTGTGCAT AATGTCTGAT AGAGATCTTT ATGACAAACT 
17860 17870 17880 17890 17900 17910 17920 

>< Xbal 

>< Rmal >< Maelll 

X Mael x Maell BsrI x 

GCAATTTACA AGTCTAGAAA TACCACGTCG CAATGTGGCT AC AT T AC AAG CAGAAAATGT AACTGGACTT 



17930 



17940 



17950 



17960 



17970 



17980 



17990 



>< Tru9I 

X Mselx Sfcl 



>< Sau3AI 
>< Ndell 

>< Mbol I 
X Mbol 

> < Fokl 
>< DpnII 

>< Dpnl 
>< BspAI 

X Bspl43I 

>< Bbsl > < BsrI 



x NlalV 
X Eco64I 

X BscBI 
>< BanI 
>< AccBlI 



Mnll X 
>< Ddel 
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TTTAAGGACT GTAGTAAGAT CATTACTGGT CTTCATCCTA CACAGGCACC TACACACCTC AGCGTTGATA 
18000 18010 18020 18030 18040 18050 18060 



>< ScrFI 
>< Mval 
>< EcoRII 
>< Eco57I 

>< Ecll36I 
>< DsaV 
>< BstOI 
>< BstNI 
>< HindllX BsiLI 
>< HincIlX Apyl 

TAAAGTTCAA GACTGAAGGA TTATGTGTTG ACATACCAGG CATACCAAAG GACATGACCT ACCGTAGACT 
18070 18080 18090 18100 18110 18120 18130 



>< Plel 
>< Nlalll 

Hinfl >< 
AccI >< 



>< Maelir Thai >< 

>< Eco0651 Mvnl >< 

>< Eco91X BstUI >< 

>< BstXI BspSOI >< 

>< BstPI >< Acil 

>< BstEII x HphI AccII X 

CATCTCTATG ATGGGTTTCA AAATGAATTA CCAAGTCAAT GGTTACCCTA ATATGTTTAT CACCCGCGAA 

18140 18150 18160 18170 18180 18190 18200 

>< XmnI 

> < MboII >< sfaNI 

> < Maelll >< 

X Asp700I ><c NiaIII 

x Alul >< Maell >< Mnll >< Mael 

GAAGCTATTC GTCACGTTCG TGCGTGGATT GGCTTTGATG TAGAGGGCTG TCATGCAACT AGAGATGCTG 



18210 



18220 



18230 



18240 



18250 



18260 



18270 



X Rsal 
X Gsul 

X Csp6I 
>< Bpml 

>< Afal 



>< Rmal 

>< Mnll 
>< Mael 
X Alul 



X Sfcl 



>< Tru9I 
>< Msel 
>< Hpal 

>< Hindll X Rsal 

X Hindi x Csp6I 

>< Ddel x Alul BsrI X 
x Bfrl x Afal 



TGGGTACTAA CCTACCTCTC CAGCTAGGAT TTTCTACAGG TGTTAACTTA GTAGCTGTAC CGACTGGTTA 
18280 18290 18300 18310 18320 18330 18340 



X Hindll 
>< Hindi 



>< HphI 

X EcoRI 



x Tru9I 
>< Msel 

FIGURE 13.42 



X ScrFI 
>< Mval 

X Mnll 
>< Maelll 
x EcoRII 

>< Eco0651 
>< EcoNI 

X Eco91I 
>< Ecll36I 
x DsaV Tru9I x 
X Drain 
>< BstPI 
X BstOI 

>< BstNI Pmel >< 
>< BstEII 
X BslI Msel X 
X BsiYI HphI X 
>< BsiLI Dral x 
>< Apyl X BsrI 
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TGTTGACACT GAAAATAACA CAGAATTCAC CAGAGTTAAT GCAAAACCTC CACCAGGTGA CCAGTTTAAA 
18350 18360 18370 18380 18390 18400 18410 

>< ScrFI 

>< Mval 
>< EcoRII 

>< EC1136I 
>< DsaV 

>< BstOI 

>< BstNI >< Rsal 

>< BsiLI Ddel >< 

>< BsaJI > < Tru9I>< Csp6I 

>< Nlalll >< Apyl > < Msel >< Afal 

CATCTTATAC CACTCATGTA TAAAGGCTTG CCCTGGAATG TAGTGCGTAT TAAGATAGTA CAAATGCTCA 
18420 18430 18440 18450 18460 18470 18480 

>< Nlalll 
>< HinPlI 
>< Tthllll >< Hin6I 

>< Hinfl > < Hhal 

>< AspT >< Plel > < Cfol >< Alul 

GTGATACACT GAAAGGATTG TCAGACAGAG TCGTGTTCGT CCTTTGGGCG CATGGCTTTG AGCTTACATC 
18490 18500 18510 18520 18530 18540 18550 

>< SinI 
>< Sau96I 
>< NspIV 

>< NspHII 
>< Eco47r 
X Cfrl3I 
>< Seal >< BsiZI 

>< Rsal >< Bmel8I 

>< Csp6I >< Avail >< Maell 

>< Afal >< Asul >< Afllll >< Maelllx Maell 

AATGAAGTAC TTTGTCAAGA TTGGACCTGA AAGAACGTGT TGTCTGTGTG ACAAACGTGC AACTTGCTTT 
18560 18570 18580 18590 18600 18610 18620 

> < Tfil >< Tthllll 

> < Hinfl > < Aspl 

TCTACTTCAT CAGATACTTA TGCCTGCTGG AATCATTCTG TGGGTTTTGA CTATGTCTAT AACCCATTTA 
18630 18640 18650 18660 18670 18680 18690 

>< ScrFI 
Rsal >< 
>< Mval 
>< EcoRII 
Ecll36I >< 

>< DsaV 
Csp6I >< 

BstXI >< 

> < Maelll >< BstOI 

> < Eco0651 >< BstNI 

> < Eco91I >< BsiLI 

> < BstPI >< Apyl 
>< Eco57I> < BstEII >< Maelll >< Nlalll Afal >< 

TGATTGATGT TCAGCAGTGG GGCTTTACGG GTAACCTTCA GAGTAACCAT GACCAACATT GCCAGGTACA 
18700 18710 18720 18730 18740 18750 18760 

>< SfaNI 
>< Rmal 
>< Nspl 
>< NspHI 
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>< Nlalll >< Rmal 

>< Mael >< Nlalll Tru9I >< 

>< Nlalll >< BspWI >< Mael >< Nlalll 

> < Afllll >< BspHI Msel >< 

TGGAAATGCA CATGTGGCTA GTTGTGATGC TATCATGACT AGATGTTTAG CAGTCCATGA GTGCTTTGTT 
18770 18780 18790 18800 18810 18820 18830 

>< Thai 

>< Mvnl 
>< HinPlI 
X Hin61 

>< Hhal 

>< Cfol 

>< BstUI >< EcoNfr> < Mnll 

>< BspSOI >< BslI >< Tru9I 

>< AccII >< BsiYI >< Ddel >< Msel 

AAGCGCGTTG ATTGGTCTGT TGAATACCCT ATTATAGGAG AT G AACT GAG GGTTAATTCT GCTTGCAGAA 
18840 18850 18860 18870 18880 18890 18900 

>< Rsal 

>< Csp6I >< MboII > < Nlalir 

>< Afal X Nlalll >< BspWI >< BsrI >< BspHI 

AAGTACAACA CATGGTTGTG AAGTCTGCAT TGCTTGCTGA TAAGTTTCCA GTTCTTCATG AC AT T GG AAA 
18910 18920 18930 18940 18950 18960 18970 

>< Saul 
>< Mstll 
>< Eco81I 

>< Ddel Nlalll >< 

>< Cvnl >< Espl 

>< Bsu36I >< Eco57I Maelll >< 

>< Bse21I >< Ddel 

>< Axyl >< Celll 

>< AocI >< Mnll >< SfaNI >< Bpull02I 

TCCAAAGGCT ATCAAGTGTG TGCCTCAGGC TGAAGTAGAA TGGAAGTTCT ACGATGCTCA GCCATGTAGT 

18980 18990 19000 19010 19020 19030 19040 

>< Mnll >< Ksp632I 

>< Hindlll >< Earl 

>< Alul >< MboII >< Eamll04I 

GACAAAGCTT ACAAAATAGA GGAACTCTTC TATTCTTATG CTACACATCA CGATAAATTC ACTGATGGTG 
19050 19060 19070 19080 19090 19100 19110 

>< Sau3AI 
>< Ndell 
>< Mbol 
>< MaeII> < Maelll 
>< DpnII 
>< Dpnl 

>< BspAI Hinfl > 

>< Maelll >< Bspl43I >< Muni DrdI >< 

TTTGTTTGTT TTGGAATTGT AACGTTGATC GTTACCCAGC CAATGCAATT GTGTGTAGGT TTGACACAAG 
19120 19130 19140 19150 19160 19170 19180 

Zsp2I >< 

>< SphI 
> < PpulOI 
>< Pael 
>< Nspl 

>< ScrFI >< NspHI 

>< Mval >< Nlalll 

x EcoRII Mphll03I x 

FIGURE 13.44 
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>< Ecll36I >< Gsul 

X DsaV EcoT22I >< 

>< BstOI >< BsmI 

>< BstNI >< BscCI 

>< BsiLI >< Bpml >< Nsil 

>< Plel >< Apyl >< Avalll 
AGTCTTGTCA AACTTGAACT TACCAGGCTG TGATGGTGGT AGTTTGTATG TGAATAAGCA TGCATTCCAC 

19190 19200 19210 19220 19230 19240 19250 

>< Tru9I 

> < Muni 

>< TthHB8I >< Msel 

>< Bcgl/a >< TaqI >< Dral 

>< Alul >< Bcgl 

ACTCCAGCTT TCGATAAAAG TGCATTTACT AATTTAAAGC AATTGCCTTT CTTTTACTAT TCTGATAGTC 
19260 19270 19280 19290 19300 19310 19320 

>< Plel SfaNI >< 

>< Nlalll >< Maell 

>< BsmAI BsaAI X 

>< Hinfix Alw26I AflHI >< 

CTTGTGAGTC TCATGGCAAA CAAGTAGTGT CGGATATTGA TTATGTTCCA CTCAAATCTG CTACGTGTAT 

19330 19340 19350 19360 19370 19380 19390 

2sp2I > 
>< Seal 

PpulOI >< 
>< RsalNsil > 
Mphll03I > 
X SfaNIEcoT22I > 
> < Rsal >< Csp6I 
>< Csp6I Avail! >< 

>< NlaIII> < Afal >< Afal 
TACACGATGC AATTTAGGTG GTGCTGTTTG CAGACACCAT GCAAATGAGT ACCGACAGTA CTTGGATGCA 
19400 19410 19420 19430 19440 19450 19460 

X Fokl 

TATAATATGA TGATTTCTGC TGGATTTAGC CTATGGATTT ACAAACAATT T GAT ACT TAT AACCTGTGGA 
19470 19480 19490 19500 19510 19520 19530 

X ScrFI 

>< Mval 

>< Maelll 
>< EcoRII 

X Ecll36I 
>< DsaV 

X BstOI 

X BstNI 

X BsiLI X Tru9I 

X Apyl >< Msel 

AT AC AT TT AC CAGGTTACAG AGTTTAGAAA ATGTGGCTTA TAATGTTGTT AATAAAGGAC ACTTTGATGG 
19540 19550 19560 19570 19580 19590 19600 

x SgrAI 
X Nael 

X Mspl > < Vspl 

X Hpall > < Tru9I 

>< HapII > < Msel 

>< CfrlOI > < Asnl 

x BspWI > < Asel 
ACACGCCGGC GAAGCACCTG TTTCCATCAT TAATAATGCT GTTTACACAA AGGTAGATGG TATTGATGTG 

19610 19620 19630 19640 19650 19660 19670 
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>< XhoII 
>< Sau3AI 
>< Ndell 
>< Mfll 
>< Mbol 
>< DpnII 

>< Dpnl >< Maelll 

>< BstYI >< EspI 

>< BspAI >< DdeITru9I >< 

>< Bspl43I >< Tru9T >< CelllMsel >< 

>< Bglll >< Msel >< Alul >< Bpull02I 

GAGATCTTTG AAAATAAGAC AACACTTCCT GTTAATGTTG CATTTGAGCT TTGGGCTAAG CGTAACATTA 
19680 19690 19700 19710 19720 19730 19740 

>< Fnu4HI 

>< Tru9I >< EcoRV 

>< BsrI >< Msel >< Bbvl >< Eco32I 

AACCAGTGCC AGAGATTAAG ATACTCAATA ATTTGGGTGT TGATATCGCT GCTAATACTG TAATCTGGGA 
19750 19760 19770 19780 19790 19800 19810 

>< Nspl 
X NspHI 
>< Nlalll 
>< Bsgl 
>< Afllll 

C T AC AAAAGA GAAGCCCCAG CACATGTATC TACAATAGGT GTCTGCACAA TGACTGACAT TGCCAAGAAA 
19820 19830 19840 19850 19860 19870 19880 

>< DdelX Mbol I >< AccI 

CCTACTGAGA GTGCTTGTTC TTCACTTACT GTCTTGTTTG ATGGTAGAGT GGAAGGACAG GTAGACCTTT 
19890 19900 19910 19920 19930 19940 19950 

Sinr >< 
Sau96I >< 
NspIV >< 
NspHII >< 
NlalV >< 
Eco47I >< 
Cfrl3I >< 

>< BslI 
BsiZI >< 

>< BsiYI 
BscBI >< 
Bmel8I >< 

>< Tru9I Avail >< 

>< Msel Asul X 

TTAGAAACGC CCGTAATGGT GTTTTAATAA CAGAAGGTTC AGTCAAAGGT CTAACACCTT CAAAGGGACC 
19960 19970 19980 19990 20000 20010 20020 

>< Vspl 
>< Tru9I 
>< Plel 

X Rmal >< Msel Tru9I >< 

>< Nhel X Maelll >< Tru9I 

x Mael >< Asnl x Tfil Msel >< 

>< Hgalx Alul >< HinfIX Asel x Hinfl >< Msel 

AGCACAAGCT AGCGTCAATG GAGTCACATT AATTGGAGAA TCAGTAAAAA CACAGTTTAA CTACTTTAAG 
20030 20040 20050 20060 20070 20080 20090 

>< Ddel X Mnll Tru9I >< 
X BstnAr X Ddel 

FIGURE 13.46 



WO 2005/056781 



60/116 



PCT/FR2004/003105 



>< AccI >< ALw2 6I >< BfrlMsel >< 

AAAGTAGACG GCATTATTCA ACAGTTGCCT GAAACCTACT TTACTCAGAG CAGAGACTTA GAGGATTTTA 
20100 20110 20120 20130 20140 20150 20160 



>< Xcml 
>< Sau3AI 
>< Ndell 
>< Mbol 
>< Dpnll 

>< Dpnl 
>< BspAI 

>< Bspl43I 



> 
> 

> 
> 
> 
> 
> 



>< 
>< 



TthHB8 I 
TaqI 

>< 
>< 
>< 

PaeR7I 
NspIII 

>< 



SstI 
Sdul 
SacI 



NspII 
>< HgiAI 

< Eco88I 

< Xhoix Eco24I 

>< Ecll36II 

< Slaix Bspl286I 

< CcrlX Bmyl 

< Bcoix Banll 

< Ama87I 

< Avaix Alw21I 

X Alul 



>< EcoRI >< 



Xhol X 
TthHB8 I > 
TaqI > 
Slal x 
PaeR7I x 
NspIII x 
>< Mnll 
Eco88I x 
Ccrl x 
BspWI X 

Bcol X 
> < Bcgl/a 

Aval >< 
Ama87I X 
FoklAluI X 



AGCCCAGATC ACAAATGGAA ACTGACTTTC TCGAGCTCGC TATGGATGAA TTCATACAGC GATATAAGCT 
20170 20180 20190 20200 20210 20220 20230 

X TthHB8 I 
X TaqI 
>< Sful 
X NspV 
X Lspl 
>< Csp4 5I 
>< BstBI 
X Bspll9I 

X BsiCI >< MboII 

X Bpul4I >< Bbsl Tru9I X 

X AsuII >< Bcgl X Nlalll X AcilMsel x 

CGAGGGCTAT GCCTTCGAAC ACATCGTTTA TGGAGATTTC AGTCATGGAC AACT TGGCGG TCTTCATTTA 
20240 20250 20260 20270 20280 20290 20300 



>< Espl 
X Ddel 
x Celll X 
x Bpull02I > 
X Bfrl 



>< HphI 
x HinPlI 
X Hin6I 

> < Hhal X Tfil 
X Haell 
Eco47III 
< Cfol X Hinfl 



X Bspl43II 



>< Tru9I 
x Msel 
x Mnll 



ATGATAGGCT TAGCCAAGCG CTCACAAGAT TCACCACTTA AATTAGAGGA TTTTATCCCT AT GG AC AGC A 



20310 



20320 



20330 



20340 



20350 



20360 



20370 



X SfaNI 



>< MstI 
x HinPlI 
>< Hin6I 
>< Hhal 
x Fspl 
x Fdill 
>< Cfol 
X Avill 



Sau3AI >< 
Ndell X 
Mbol x 
Dpnll x 

Dpnl >< 
BspAI X 
Bspl43I >< 



CAGTGAAAAA TTACTTCATA ACAGATGCGC AAACAGGTTC ATCAAAATGT GTGTGTTCTG TGATTGATCT 
20380 20390 20400 20410 20420 20430 20440 



X TthHB8I 
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>< Tthllll 
>< TaqI 

>< Aspl > < Maelll Maelll >< 

TTTACTTGAT GACTTTGTCG AGATAATAAA GTCACAAGAT TTGTCAGTGA TTTCAAAAGT GGTCAAGGTT 
20450 20460 20470 20480 20490 20500 20510 

>< Nspl 
>< NspHI 
>< Nlalll 
>< Fokl 

>< Muni > < Nlalll >< AfLIII 

ACAATTGACT ATGCTGAAAT TTCATTCATG CTTTGGTGTA AGGATGGACA TGTTGAAACC TTCTACCCAA 
20520 20530 20540 20550 20560 20570 20580 

>< SfaNI 

>< ScrFI 

>< Mval 
>< EcoRII 

>< Ecll36I 
>< DsaV 

>< BstOI >< SfaNI 

>< BstNI >< Rsal BspWI >< 

>< BsiLI > < Csp6I BsmI > 

>< BspWI >< Apyl >< Afal BscCI >< 

AACTACAAGC AAGTCAAGCG TGGCAACCAG GTGTTGCGAT GCCTAACTTG TACAAGATGC AAAGAATGCT 
20590 20600 20610 20620 20630 20640 20650 

>< Eco57I >< Maelll >< HphI 

TCTTGAAAAG TGTGACCTTC AGAATTATGG TGAAAATGCT GTTATACCAA AAGGAATAAT GATGAATGTC 
20660 20670 20680 20690 20700 20710 20720 

> < Rsal 
>< Csp6I 

>< Bstll07I >< Tru9I >< Alul 

>< AccI >< Msel > < AfalNlalll >< 

GCAAAGTATA CTCAACTGTG TCAATACTTA AATACACTTA CTTTAGCTGT ACCCTACAAC ATGAGAGTTA 
20730 20740 20750 20760 20770 20780 20790 

>< ScrFI 

>< Rsal 
>< Mval 
>< EcoRII >< NspBII 

>< Ecll36I >< Sdul 

> < Csp6I >< NspII 

>< BstOI >< Pvullx HgiAI 
>< BstNI >< Ddel 

>< BsiLI X PspSlX Bspl286I 
>< Apyl >< Alul X Bmyl 
>< DsaVx Afal >< Alw21I 

TTCACTTTGG TGCTGGCTCT GATAAAGGAG TTGCACCAGG TACAGCTGTG CTCAGACAAT GGTTGCCAAC 
20800 20810 20820 20830 20840 20850 20860 

>< XhoII 

>< Tru9I 
>< Sau3AI 
>< Ndell 
>< TthHB8I >< Msel 
>< Mfll 
>< Mbol 
>< MamI 
>< Dprtll 
>< Tfil >< Dpnl 

FIGURE 13. 4 8 
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>< BstYI 
>< BspAI 
>< HinfIX Bspl43I 
>< BsiBI 
X BsaBI 



> < Tfil 

> < Hinfl 

>< Esp3I >< Tru9I 

>< Tthllll >< BsraBI >< Msel 

>< BsmAI > < BsmAI 



>< BsrI >< TaqI >< Bglll >< Aspl >< Alw26I >< Hgal> < Alw26I 

TGGCACACTA CTTGTCGATT CAGATCTTAA TGACTTCGTC TCCGACGCAG ATTCTACTTT AATTGGAGAC 
20870 20880 20890 20900 20910 20920 20930 

>< 



>< Rsal 
< Csp6X 
>< Afal 



> 
> 



< SinI 

< Sau96I 

>< PssI 
>< PspSII 

< PpuMI 

< NspIV 
>< NspHII 
X NlalV 

< EcoO109I 

< Eco47I 

< Drall 

< Cfrl3I 

< BsiZI 
X BscBI 

< Bmel8I 

< Avail 

< Asul 



Styl 

x SinI 
X Sau96l 
X Rmal 

X NspIV 
NspHII X 
>< Mae I 
X EcoT14I 

>< Eco4 7l 
X Ecol30I 

>< Cfrl3I 
X BssTlI 

>< BsiZI 
X BsaJI 

X Bmel8I 
X Blnl 
X Avrll 

X Avail 
X Asul 
. Afllll X 



TGTGCAACAG TACATACGGC TAATAAATGG GACCTTATTA TTAGCGATAT GTATGACCCT AGGACCAAAC 

20940 20950 20960 20970 20980 20990 21000 

X Nspl 
X NspHI 

>< Nlalll >< Plel Rmal x 

x Maelll X Hinfl Mael X 

ATGTGACAAA AGAGAATGAC TCTAAAGAAG GGTTTTTCAC TTATCTGTGT GGATTTATAA AGCAAAAACT 

21010 21020 21030 21040 21050 21060 21070 



X ScrFI 

X Mval 
X EcoRII 

X EC1136I 
X DsaV 

X BstOI 

X BstNI 

X BsiLI 
X BsaJI 
X BsaJI 

X Apyl 



Sau96I 
NspIV 
Cfrl3I 
BsiZI 
Asul 



x Sfcl x BsmI >< BsmI . 

> < Alul X BscCI >< BscCIHindlll ><>< Alul 

AGCCCTGGGT GGTTCTATAG CTGTAAAGAT AACAGAGCAT TCTTGGAATG CTGACCTTTA CAAGCTTATG 
21080 21090 21100 21110 21120 21130 21140 



X Zsp2I 
>< PpulOI 

>< Pall X Nsil 

x Haelll >< Mphll03I 

X BsuRI X Maelll x EcoT22I 

X BshI X NlalllX Alul >< Bcgl >< Avalll X SfaNIBcgl/a X 

GGCCATTTCT CATGGTGGAC AGCTTTTGTT ACAAATGTAA ATGCATCATC ATCGGAAGCA TTTTTAATTG 
21150 21160 21170 21180 21190 21200 21210 



Tru9I >< 

>< Msel 
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>< Zsp2I 
>< SphI 
>< PpulOI 

>< Pael 
>< Nspl 
>< NspHI 
>< Nsil 
>< Nlalll 

> < Nlalll 

>< Mphll03I 
X EcoT22I 

> <. Avail I >< Mnll 
GGGCTAACTA TCTTGGCAAG CCGAAGGAAC AAATTGATGG CTATACCATG CATGCTAACT ACATTTTCTG 

21220 21230 21240 21250 21260 21270 21280 

Tru9I >< 

X MboII >< Tru9I 

>< Gsul Msel >< 

>< BsrI >< Msel 

>< Bpml Mnll >< 

>< Bbsl >< Nlalll >< MnH 

GAGGAACACA AATCCTATCC AGTTGTCTTC CTATTCACTC TTTGACATGA GCAAATTTCC TCTTAAATTA 
21290 21300 21310 21320 21330 21340 21350 

>< Tru9I 
>< Msel 
>< Esp4I> < Tfil 
>< BsmAI Ksp632I >< 

>< Alw26I >< MboII >< Earl 

>< AflII> < Hinfl Eamll04I >< 

AGAGGAACTG CTGTAATGTC TCTTAAGGAG AATCAAATCA ATGATATGAT TTATTCTCTT CTGGAAAAAG 
21360 21370 21380 21390 21400 21410 21420 

>< Tru9I 
>< Msel 
>< Hindll 
>< Hindi 
>< Hpal AflHI > 

GTAGGCTTAT CATTAGAGAA AAC AAC AG AG TTGTGGTTTC AAGTGATATT CTTGTTAACA ACTAAACGAA 
21430 21440 21450 21460 21470 21480 21490 

>< Vnel 
>< Snol 

>< Sdul 
>< NspII 
>< Hpall 

x HgiAI 
X HapII 
>< CfrlOI 

x Bspl286I 
>< Msplx Brayl 

X Nspl X Spel >< ApaLI 

X NspHI >< Rmal >< Alw44I 

>< Nlalll >< Mael x Maelll x Agel >< Alw21I 

CATGTTTATT TTCTTATTAT TTCTTACTCT CACTAGTGGT AGTGACCTTG ACCGGTGCAC CACTTTTGAT 
21500 21510 21520 21530 21540 21550 21560 

> < Alul >< Mnll 

GATGTTCAAG CTCCTAATTA CACTCAACAT ACTTCATCTA TGAGGGGGGT TTACTATCCT GATGAAATTT 
21570 21580 21590 21600 21610 21620 21630 

X Sau3AI 

FIGURE 13. 50 
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>< Ndell 
>< Mbol 
>< DpnII 

>< Dpnl >< Tru9I 

>< BspAI >< Msel > < MboII 

>< Bspl43I >< Ddel >< Maelll 

TTAGATCAGA CACTCTTTAT TTAACTCAGG ATTTATTTCT TCCATTTTAT TCTAATGTTA CAGGGTTTCA 
21640 21650 21660 21670 21680 21690 21700 



>< Vspl 
X Tru9I 
>< Msel 

X Asnl >< Tru9I >< Fokl 

>< Asel >< Maell >< Msel X Bbvl > < Fnu4HI 

TACTATTAAT CATACGTTTG GCAACCCTGT CATACCTTTT AAGGATGGTA TTTATTTTGC TGCCACAGAG 
21710 21720 21730 21740 21750 21760 21770 



>< BslI 

>< Dsaix BsiYI >< Nlalll 

>< BsaJI > < Mae I II 

AAATCAAATG TTGTCCGTGG TTGGGTTTTT GGTTCTACCA TGAACAACAA GTCACAGTCG GTGATTATTA 

21780 21790 21800 21810 21820 21830 21840 



>< Nspl 

>< Tru9I X NspHI 

>< Msel X Nlalll 

>< HphI >< Maelll >< Maelll 

TTAACAATTC TACTAATGTT GTTATACGAG CATGTAACTT TGAATTGTGT GACAACCCTT TCTTTGCTGT 
21850 21860 21870 21880 21890 21900 21910 



>< Styl 

X Nlalll 
>< Ncol >< Rsal 
>< EcoT14I 
>< Ecol30I 
>< DsalX Csp6I 
X BssTlI 
x BsaJlx Afal 
TTCTAAACCC ATGGGTACAC AGACACATAC 
21920 21930 21940 



>< Zsp2I 

X Tru9I 
X PpulOI TthHB8I >< 

>< Nsil >< TaqI 

>< Msel SfaNI x 
X Mphll03I Rsal X 

X TthHB8 I X EcoT22I Csp6I >< 
X TaqI X Aval 1 1 Afal X 

TATGATATTC GATAATGCAT TTAATTGCAC TTTCGAGTAC 
21950 21960 21970 21980 



X Tru9I 
>< Msel 
X Dral 

AT AT CTGATG CCTTTTCGCT TGATGTTTCA GAAAAGTCAG GTAATTTTAA ACACTTACGA GAGTTTGTGT 
21990 22000 22010 22020 22030 22040 22050 

X Sau3AI 
>< Ndell 
x Mbol 
>< DpnII 

X Tru9I X Dpnl 

X Msel >< BspAI 

>< Dral X Sfcl Bspl43I >< 

TTAAAAATAA AGATGGGTTT CTCTATGTTT ATAAGGGCTA TCAACCTATA GATGTAGTTC GTGATCTACC 
22060 22070 22080 22090 22100 22110 22120 



X Tru9I 

X Tru9I > < Tru9I x Msel 

>< Msel > < Msel >< Mnll 

TTCTGGTTTT AACACTTTGA AACCTATTTT TAAGTTGCCT CTTGGTATTA AC ATT AC AAA TT T TAG AG CC 
22130 22140 22150 22160 22170 22180 22190 
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> < Sdulx Sfcl 

>< PvuII 
>< PspSI 

> < NspII 

>< NspBII 

> < Maell > < Fnu4HI 

> < Bspl286I >< PstI Tru9I > 
>< BspMI > < Bmylx Fnu4HI Msel > 

>< HphI >< Bbvl >< Alul >< Bbvl 

ATTCTTACAG CCTTTTCACC TGCTCAAGAC ATTTGGGGCA CGTCAGCTGC AGCCTATTTT GTTGGCTATT 
22200 22210 22220 22230 22240 22250 22260 

>< SfaNI 
>< Rsal 

> < Csp6I 

X Dral >< Afal >< AlwNI 

TAAAGCCAAC TACATTTATG CTCAAGTATG ATGAAAATGG TACAATCACA GATGCTGTTG ATTGTTCTCA 
22270 22280 22290 22300 22310 22320 22330 

> < Tru9I 

> < Msel 

>< Alul 

AAATCCACTT GCTGAACTCA AATGCTCTGT TAAGAGCTTT GAGATTGACA AAGGAATTTA CCAGACCTCT 
22340 22350 22360 22370 22380 22390 22400 

>< Saul 
>< Mstll 
>< Eco81I 
X Ddel 
>< Cvnl 
>< Bsu36I 
>< Bse21I 

>< Axyl X Tfil 

>< Mnll >< AocI >< Mnll X Hinfl >< Sspl >< Mnll 

AATTTCAGGG TTGTTCCCTC AGGAGATGTT GTGAGATTCC CTAATATTAC AAACTTGTGT CCTTTTGGAG 
22410 22420 22430 22440 22450 22460 22470 

X Zsp2I 
>< PpulOI 

>< Nsil 

> < Nlalll 
X Mphll03I 

>< Tru9I x EcoT22I 

x Msel >< Avalll 

AGGTTTTTAA TGCTACTAAA TTCCCTTCTG TCTATGCATG GGAGAGAAAA AAAATTTCTA ATTGTGTTGC 
22480 22490 22500 22510 22520 22530 22540 

>< Sdul 
x NspII 
x HgiAI 
>< Bspl286I 

X Bmyl X Tru9I 

>< Alw21I >< Msel Ddel x 

TGATTACTCT GTGCTCTACA ACTCAACATT TTTTTCAACC TTTAAGTGCT ATGGCGTTTC TGCCACTAAG 
22550 22560 22570 22580 22590 22600 22610 

>< Sau3AI 
x Ndell 
>< Mbol 
X DpnII 
X Dpnl 

FIGURE 135 2 
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>< BspAI >< TfiI 

X BspL43I >< Hinfl 

TTGAATGATC TTTGCTTCTC CAATGTCTAT GCAGATTCTT TTGTAGTCAA GGGAGATGAT GTAAGACAAA 
22620 22630 22640 22650 22660 22670 22680 

>< ScrFI 
>< Mval 
>< HinPlI 
>< Hin6I 
>< Hhal 

>< Haell 
>< EcoRII 

>< EclL36I 
>< DsaV 
>< Cfol 
>< BstOI 
>< BstNI 
>< Bspl43II 
>< BsiLI 

X Apyl > < BsrI >< Nlalll 

TAGCGCCAGG ACAAACTGGT GTTATTGCTG ATTATAATTA TAAATTGCCA GATGATTTCA TGGGTTGTGT 
22690 22700 22710 22720 22730 22740 22750 

>< SfaNI 

>< Rmal Ddel >< 

>< Mael >< BsrI Bfrl >< 

CCTTGCTTGG AATACTAGGA ACATTGATGC TACTTCAACT GGTAATTATA AT T AT AAAT A TAGGTATCTT 

22760 22770 22780 22790 22800 22810 22820 



>< Sau96I 

>< Pall 
X NspIV 
> < Hindi ri 

>< Haelll 
>< EcoO109I 
X Drall 
Ddel 
X Cfrl3I 
X BsuRI 
X BsiZI 
X BshI 
Bfrl X PssI 
>< Nlalll X Asulx BsraAI 

X Alul X Alw26I BspWI >< 

AGACATGGCA AGCTTAGGCC CTTTGAGAGA GACATATCTA ATGTGCCTTT CTCCCCTGAT GGCAAACCTT 



X 



X 

Nlalll 



22830 



22840 



22850 



22860 



22870 



22880 



22890 



X Tru9I 
>< Pall 
>< MscI 
X Haelll 
>< Eaeix Msel 
X Tru9I x BsuRI 

X Msel >< BshI 

X BspMI >< Ball BsrI x 

GCACCCCACC TGCTCTTAAT TGTTATTGGC CATTAAATGA TTATGGTTTT TACACCACTA CTGGCATTGG 
22900 22910 22920 22930 22940 22950 22960 



Sau96I x 
>< PallNspIV x 
> < Mspl NspHII >< 
X Haelll 



FIGURE 13.53 
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>< Seal 
>< Rsal 
>< Csp6I 
>< Afal 

CTACCAACCT TACAGAGTTG TAGTACTTTC TTTTGAACTT 
22970 22980 22990 23000 



> < Hpall Eco47I >< 

>< Dsal 

> < HapII Cfrl3I >< 

>< BsuRISinI >< 
>< Gdill BsiZI >< 
>< BsaJI 
>< Tru9I >< Eael Bmel8I >< 
>< Msel >< CfrlOI Avail >< 
>< Dral >< BshI Asul >< 

T T AAATGC AC CGGCCACGGT TTGTGGACCA 
23010 23020 23030 



>< Tru9I 
X Tru9I 

>< Plel 
>< Msel 



>< Rsal 
>< Csp6I 
BsrI >< 
>< BsrI 
>< Afal 



> < Tru9I 

> < Mseix BsrI >< Msel >< Hinfl 
AAATTATCCA CTGACCTTAT TAAGAACCAG TGTGTCAATT TTAATTTTAA TGGACTCACT GGTACTGGTG 

23040 23050 23060 23070 23080 23090 23100 



X Tru9I 

x Msel 
X MboII 
>< Hpal 
X Hindll 
X Hindi 



X Pall 
>< Haelll 

x Gdill 

x Eael 
X BsuRI 
>< BshI 



Tfil >< 
Hinfl >< 



TGTTAA.CTCC TTCTTCAAAG AGATTTCAAC CATTTCAACA ATTTGGCCGT GATGTTTCTG ATTTCACTGA 
23110 23120 23130 23140 23150 23160 23170 



X 
X 



> < XhoII 
TthHB8I 
TaqI 

> < Sau3AI 
Ndell 
Mfll 
Mbol 
DpnII 

X Dpnl 

< BstYI 

< BspAI 



> 
> 
> 
> 

> 
> 



< 
< 
< 
< 



> < Sspl 

X HphI 

TTCCGT TCG A GATCCTAAAA CATCTGAAAT AT TAG AC AT T TCACCTTGCT CTTTTGGGGG TGTAAGTGTA 
23180 23190 23200 23210 23220 23230 23240 



>< Alwl X Bspl43I 



X ScrEI 
X Mval 
>< EcoRII 

X Ecll36I 
>< DsaV 
X BstOI 
X BstNI 
X BsiLI 
X Apyl 



X Tru9I 
X Msel 
X Hpal 
x Hindll 
X Eco57I 
x Bsgl >< Hindi 



ATTACACCTG GAACAAATGC TTCATCTGAA GTTGCTGTTC TATATCAAGA TGTTAACTGC ACTGATGTTT 
23250 23260 23270 23280 23290 23300 23310 



X Sau3AI 
X Nialll 
X Ndell 
x Mbol 
x DpnII 
X Dpnl 



x HinPlI 
FIGURE 13. 5 4 
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>< BspWI >< Hin6I 

>< BspAI > < Hhal Plel >< 

>< Sfcl >< Bspl43I >< Alul> < Cfol >< Bsrl 

CTACAGCAAT TCATGCAGAT CAACTCACAC CAGCTTGGCG CATATATTCT ACTGGAAACA AT GT ATT CCA 



23320 



23330 



23340 



23350 



23360 



23370 



23380 



>< TthHB8 I 
>< TaqI 
>< Sail 
>< Rtrl 
X Nspl 
>< Espl >< NspHI 
>< Ddel >< Nlalll 
>< Celll >< Hindll 
>< Bpull02I>< Hindi 
>< Hinfl >< Aiul >< AccI 

GACTCAAGCA GGCTGTCTTA TAGGAGCTGA GCATGTCGAC ACTTCTTATG AGTGCGACAT TCCTATTGGA 
23390 23400 23410 23420 23430 23440 23450 

> < SnaBI 

>< Seal 
>< Rsal 
>< Rmal 
>< MaelT >< Mael 

> < Ecol05I 
>< Rmal >< Csp6I 

>< Maelll > < BsaAI 

>< Aiul >< Mael >< Afal 

GCTGGCATTT GTGCTAGTTA CCATACAGTT TCTTTATTAC GTAGTACTAG CCAAAAATCT ATTGTGGCTT 
23460 23470 23480 23490 23500 23510 23520 

x Muni 

ATACTATGTC TTTAGGTGCT GATAGTTCAA TTGCTTACTC TAATAACACC ATTGCTATAC CTACTAACTT 
23530 23540 23550 23560 23570 23580 23590 

Rsal >< 
>< Mnll 

Csp6I >< 

>< Sfcl Afal >< 

TTCAATTAGC ATTACTACAG AAGTAATGCC TGTTTCTATG GCTAAAACCT CCGTAGATTG TAATATGTAC 
23600 23610 23620 23630 23640 23650 23660 

> < Tfil 

> < Hinfl 

>< Acil > < Aiul 

ATCTGCGGAG ATTCTACTGA ATGTGCTAAT TTGCTTCTCC AATATGGTAG CTTTTGCACA CAACTAAATC 
23670 23680 23690 23700 23710 23720 23730 



>< Vnel 

>< Sdul 

>< NspII 

>< HgiAI 
>< SnoIX Ddel 

>< Bspl286I 

>< Bmyl 

>< Bbvl 
>< ApaLI 
>< Alw4 4I 

>< Alw21I 



X 
X 
X 



Sau3AI 
Ndell 
Mbol 
x Dpnl 
X Bspl43I 



>< Pmll 
>< PmaCI 
x Maell 
>< Eco72I 
>< BsaAI 
>< BbrPI 



>< DpnII >< Alwl 
>< Fnu4HI X BspAI >< Afllll 
GTGCACTCTC AGGTATTGCT GCTGAACAGG ATCGCAACAC ACGTGAAGTG TTCGCTCAAG TCAAACAAAT 
23740 23750 23760 23770 23780 23790 23800 



FIGURE 13.55 



WO 2005/056781 



69/116 



PCT/FR2004/003105 



>< Rsal 

>< Csp6I >< Tru9I 

>< Afal >< Sspl >< Msel >< Sspl 

GTACAAAACC CCAACTTTGA AATATTTTGG TGGTTTTAAT TTTTCACAAA TATTACCTGA CCCTCTAAAG 
23810 23820 23830 23840 23850 23860 23870 

>< Mnll 

>< Mnll >< Tru9I >< SfaNI >< HphI Nlalll >< 

>< Ddel >< Mnll >< Msel >< Maelll BspHI >< 

CCAACTAAGA GGTCTTTTAT TGAGGACTTG CTCTTTAATA AGGTGACACT CGCTGATGCT GGCTTCATGA 
23880 23890 23900 23910 23920 23930 23940 

X XhoII 
>< Sau3AI 
>< Styl >< RmaX 

>< Rmal >< Ndell 

>< Mael >< Mfll 

>< EcoT14I >< Mbol >< Mstl 

>< Ecol30I >< Mael >< HinPlI 

>< BssTlI >< Vspl >< DpnII >< Hin6I 

>< Bsml >< Hphl> < Dpnl X Hhal 

>< BscCI >< Tru9I >< BstYI >< Fspl 

X BsaJI >< Msel X BspAI >< Fdill 

>< Blnl >< Asnl > < Bspl43I X Cfol 

>< Avrll >< Asel >< Bglll >< Avill 

AGCAATATGG CGAATGCCTA GGTGATATTA ATGCTAGAGA TCTCATTTGT GCGCAGAAGT TCAATGGACT 

23950 23960 23970 23980 23990 24000 24010 

>< RmalRsal >< 
>< Mnll >< Fnu4HI >< Fnu4HI Csp6I >< 

>< BspWr >< Bbvl >< Bbvl >< BspWI >< MaelAfal X 

TACAGTGTTG CCACCTCTGC TCACTGATGA TATGATTGCT GCCTACACTG CTGCTCTAGT TAGTGGTACT 
24020 24030 24040 24050 24060 24070 24080 

>< Mbol I 
>< HinPlI 
>< Hin6I 
>< Hhal 
>< Haell 

>< Fnu4HI >< Ksp632I 
>< Cfol >< Earl 
>< Fokl >< BspWI >< Eamll04I 
>< Bbvl >< Bspl43II 

GCCACTGCTG GATGGA.CATT TGGTGCTGGC GCTGCTCTTC AAATACCTTT TGCTATGCAA ATGGCATATA 
24090 24100 24110 24120 24130 24140 24150 

Tru9I >< 

>< Maelll Msel >< 

GGTTCAATGG CATTGGAGTT ACCCAAAATG TTCTCTATGA GAACCAAAAA CAAATCGCCA ACCAATTTAA 
24160 24170 24180 24190 24200 24210 24220 

Maell >< 

>< Tfil >< Fnu4HI 

>< Kinfl >< Bbvl >< AluT 

CAAGGCGATT AGTCAAATTC AAG AAT C ACT TACAACAACA TCAACTGCAT TGGGCAAGCT GCAAGACGTT 
24230 24240 24250 24260 24270 24280 24290 

>< Tru9I 
>< Msel 

>< Hpal >< Ddel 

>< Hindll >< Bsml X Tru9I >< Tru9I >< Bfrl 

>< HincIlX BscCI x Msel X Msel x Alul 

FIGURE 13. 56 
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GTTAACCAGA ATGCTCAAGC ATTAAACACA CTTGTTAAAC AACTTAGCTC TAATTTTGGT GCAATTTCAA 
24300 24310 24320 24330 24340 24350 24360 

>< Thai 
>< Spol 
>< Nrul 
>< Mvnl 

>< BstUI >< TthHB8 I 

X Bsp68I >< TaqI >< Rsal 

>< EcoRV >< BspSOI >< Mnll >< Csp6I >< Tru9I 

>< Eco32I >< AccII >< Mnll >< Acilx Afal >< Msel 

GTGTGCTAAA TGATATCCTT TCGCGACTTG ATAAAGTCGA GGCGGAGGTA CAAATTGACA GGTTAATTAC 
24370 24380 24390 24400 24410 24420 24430 

>< Maelll >< Bbvl >< Fnu4HI Bbvl >< 

AGGCAGACTT CAAAGCCTTC AAACCTATGT AACACAACAA CTAATCAGGG CTGCTGAAAT CAGGGCTTCT 
24440 24450 24460 24470 24480 24490 24500 

>< Fnu4HI >< 'Hindll 

>< BspWI >< Ddel >< Hindi 

GCTAATCTTG CTGCTACTAA AATGTCTGAG TGTGTTCTTG GACAATCAAA AAGAGTTGAC TTTTGTGGAA 
24510 24520 24530 24540 24550 24560 24570 

> < Nspl 

> < NspHI 

> < Nlalll 
>< Maelll 

>< Nlalll >< Maell 

>< MboII >< Fokl 

>< Fnu4HI >< Bbsl BsaAI >< 

>< Acilx Bbvl x Afllll 

AGGGCTACCA CCTTATGTCC TTCCCACAAG CAGCCCCGCA TGGTGTTGTC TTCCTACATG TCACGTATGT 
24580 24590 24600 24610 24620 24630 24640 

X ScrFI 
>< Mval 
X EcoRII 
X Ecll36I 
X BstOI 

X BstNI X HinPlI 

X Mnll x BslI x Hin6I 

X DsaVx BsiYI >< Hhal 

>< BsiLI >< Haell 

>< BsaJlx HphI >< Cfol x Nlalll 

X Apyl >< Bspl43II >< BspHI EcoNI X 

GCCATCCCAG GAGAGGAACT TCACCACAGC GCCAGCAATT TGTCATGAAG GCAAAGCATA CTTCCCTCGT 
24650 24660 24670 24680 24690 24700 24710 

X Mnll 
X BslI X Tru9I 

X BsiYI >< Msel X Mnll 

GAAGGTGTTT TTGTGTTTAA TGGCACTTCT TGGTTTATTA CACAGAGGAA CTTCTTTTCT CCACAAATAA 
24720 24730 24740 24750 24760 24770 24780 

>< Ddel >< Tru9I 

>< BsmAI >< SfaNI 

>< Sfcl >< Alw26I X MselAlwI >< 

TTACTACAGA CAATACATTT GTCTCAGGAA ATTGTGATGT CGTTATTGGC AT CAT T AAC A ACACAGTTTA 

24790 24800 24810 24820 24830 24840 24850 

X Sau3AI 
>< Ndell 
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>< Mbol >< Plel > < Seal 

X DpnII >< Mnll > < Ksp632I > < Rsal 

>< Dpnl >< Ddel >< Hinfl >< MboII 

>< BspAI X BspWI > < Eamll04I >< Csp6I 

X Bspl43I >< AluT > < Earl > < Alul > < Afal > < HphI 

TGATCCTCTG CAACCTGAGC TTGA.CTCATT CAAAGAAGAG CTGGACAAGT ACTTCAAAAA TCATACATCA 

24860 24870 24880 24890 24900 24910 24920 

>< Sau3AI 
>< Ndell 
>< Mbol 
>< MamI 
>< DpnII 

>< Dpnl 
>< BspAI 

>< Bspl43I 

>< BsiBI >< Tru9I >< Hindll 

>< BsaBI >< Msel >< Hindi Acil >< 

CCAGATGTTG ATCTTGGCGA CATT TCAGGC ATTAACGCTT CTGTCGTCAA CATTCAAAAA GAAATTGACC 
24930 24940 24950 24960 24970 24980 24990 

X Tru9I 

> < Tfil 
>< Mnll >< Swal 

>< EcoNI >< Msel 

>< BslI > < Hinfl 

>< MnllX BsiYI >< Dral 

GCCTCAATGA GGTCGCTAAA AATT TAAATG AATCACTCAT TGACCTTCAA GAATTGGGAA AATATGAGCA 
25000 25010 25020 25030 25040 25050 25060 

>< Styl 
>< Pall 
>< Haelll 

>< EcoT14I 

>< Ecol30I 
>< BsuRI 

>< BssTlI Nlalll X 

>< Tru9I>< BshI Maelll x 

>< Msel X BsaJI >< BstXI 

AT AT ATT AAA TGGCCTTGGT ATGT TTGGCT CGGCTTCATT GCTGGACTAA TTGCCATCGT CATGGTTACA 
25070 25080 25090 25100 25110 25120 25130 

> < SphI 

> < Pael 

>< Spel > < Nspl 

> < Ritual > < NspHI 
>< Nlalll > < Nlalll 

> < Mael >< MnllX Bbvl Fnu4HI >< 
ATCTTGCTTT GTTGCATGAC TAGTTGTTGC AGTTGCCTCA AGGGTGCATG CTCTTGTGGT TCTTGCTGCA 

25140 25150 25160 25170 25180 25190 25200 

>< Fokl 
>< Ddel 

>< Mnll >< PlelX Hinfl >< BsrI 

AGTTTGATGA GGATGACTCT GAGCCAGTTC TCAAGGGTGT CAAATTACAT TACACATAAA CGAACTTATG 
25210 25220 25230 25240 25250 25260 25270 

>< Sau3AI 
>< Ndell 
>< Mbol 
>< DpnII 
> < Dpnl 
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>< BspAI 

> < Bspl43I 

>< Bsgl >< Alwl >< BsrI BspWI > 

GATTTGTTTA TGAGATTTTT TACTCTTGGA TCAATTACTG CACAGCCAGT AAAAAT TG AC AATGCTTCTC 
25280 25290 25300 25310 25320 25330 25340 



>< Seal 
>< Rsal 
>< Csp6I >< Sfcl 

>< Afal >< NlaXII >< Acil >< Mnll Fokl > 

CTGCAAGTAC TGTTCATGCT ACAGCAACGA TACCGCTACA AGCCTCACTC CCTTTCGGAT GGCTTGTTAT 

25350 25360 25370 25380 25390 25400 25410 

> < HinPlI 

> < Hin6I 

>< Hhal Rmal >< 

>< Haell >< HinPlI Nhel >< 

>< Eco47III >< Hin6I Mael >< 

>< Cfol >< Hhal Fnu4HI >< 

>< BspWI >< Bspl4 3II >< Cfol Alul >< 

TGGCGTTGCA TTTCTTGCTG TTT TTCAGAG CGC T ACC AAA ATAATTGCGC TCAATAAAAG ATGGCAGCTA 

25420 25430 25440 25450 25460 25470 25480 



>< EcoNI 
>< BslI 

>< BsiYI >< Maelll 

>< Bbvl >< BsrI X Bbvl > < Fnu4HI Bbvl >< 

GCCCTTTATA AGGGCTTCCA GTTCATTTGC AATTTACTGC TGCTATTTGT TACCATCTAT TCACATCTTT 
25490 25500 25510 25520 25530 25540 25550 



Zsp2I >< 
PpulOI >< 

> < Sfcl >< HinPlI Nsil >< 

>< PstI >< Hin6I >< Rsal Mphll03I >< 

> < Fnu4HI >< Hhal >< Csp6I EcoT22I >< 
>< BspMI >< Mnll >< Cfol >< Afal >< MnLI Avalll >< 

TGCTTGTCGC TGCAGGTATG GAGGCGCAAT TTTTGTACCT CTATGCCTTG ATATATTTTC TACAATGCAT 
25560 25570 25580 25590 25600 25610 25620 



>< SfaNI 
>< Nspl 
>< NspHI 

>< Nlalll >< SfaNI 

CAACGCATGT AGAATTATTA TGAGATGTTG GCTTTGTTGG AAGTGCAAAT CCAAGAACCC ATTACTTTAT 
25630 25640 25650 25660 25670 25680 25690 



>< Bstll07I 
>< AccI Maelll >< 

GATGCCAACT ACTTTGTTTG CTGGCACACA CATAACTATG ACTACTGTAT ACCATATAAC AGTGTCACAG 
25700 25710 25720 25730 25740 25750 25760 



>< MboII 

>< HphI BstXI >< 

>< Muni >< Maelll >< Maelll >< Eco57I >< Bbsl Mnll > 

ATACAATTGT CGTTACTGAA GGT GACGGCA TTTCAACACC AAAACTCAAA GAAGACTACC AAATTGGTGG 
25770 25780 25790 25800 25810 25820 25830 



>< Rsal 

> < Nlalll 
>< HphI 
>< Tru9I >< TthllllX Csp6I 
X Ddel >< Ddel X Mselx Aspl X Afal 
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TTATTCTGAG GATAGGCACT CAGGTGTTAA AGACTATGTC GTTGTACATG GCTATTTCAC CGAAGTTTAC 
25840 25850 25860 25870 25880 25890 25900 

Tru9I >< 

> < Hinfix Pier >< BsrI Msel >< 

>< Alul >< AccI >< Sfcl >< AlwNI >< MboII Hindlll > 

TACCAGCTTG AGTCTACACA AATTACTACA GACACTGGTA TTGAAAATGC TACATTCTTC ATCTTTAACA 
25910 25920 25930 25940 25950 25960 25970 

> < TthHB8I 

>< Tru9r > < Taql >< Ksp632I 

>< Msel > < MboII >< Earl BspWI >< 

><c AiuI >< Eco57I >< Eamll04I Alwl >< 

AGCTTGTTAA AGACCCACCG AATGTGCAAA T AC AC ACAAT CGACGGCTCT TCAGGAGTTG CTAATCCAGC 
25980 25990 26000 26010 26020 26030 26040 

>< XhoII 
>< Sau3AI 

>< NlalV 
>< Ndell 
>< Mfll 
>< Mbol 
>< DpnII 

>< Dpnl 
>< BsfcYI 
>< BstI 
>< BspAI 

>< Bspl43I Rsar >< 

>< BscBI >< Rmai: Csp6I x 

>< BamHI X Alwl >< Mael Afal X 

AATGGATCCA AT T TAT GAT G AGCCGACGAC GACTACTAGC GTGCCTTTGT AAGCACAAGA AAGTGAGTAC 
26050 26060 26070 26080 26090 26100 26110 

> < Tru9I 
X Rsal 

> < Msel 
X Mbotl 

> < Rsar >< Maell >< Rsal 
>< Csp6r >< Csp6r x Tru9r >< Csp6I 

> < Afar >< Afar x Msel x Afal 
GAACTTATGT ACTCATTCGT TTCGGAAGAA ACAGGTACGT TAATAGTTAA TAGCGTACTT CTTTTTCTTG 

26120 26130 26140 26150 26160 26170 26180 

X TthHB81 
>< Taqr 

X Rmal >< HinPlI > < Rsar 

> < Maerrr >< Hin6I Fnu4Hr >< 

x Mael x Rmal x Hhal x Csp6I 

x Fokl x Mael x cfol x Bbvl > < Afal 

CTTTCGTGGT ATTCTTGCTA GTCACACTAG CCATCCTTAC TGCGCTTCGA TTGTGTGCGT ACTGCTGCAA 
26190 26200 26210 26220 26230 26240 26250 

X Tru9r 

X Tru9I >< ThaI 

x Msel >< Mvnl 

>< Sspl >< Maell >< Mser 

><c H P aI >< BstUI Ksp632r > 

x Hindir >< Maerr >< Bsp50r x Mboir Earr > 

X Hincri >< Accr >< Accrr Eamll04r > 

TATTGTTAAC GTGAGTTTAG TAAAACCAAC GGTTTACGTC TACTCGCGTG TTAAAAATCT GAACTCTTCT 

26260 26270 26280 26290 26300 26310 26320 
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>< Sau3AI 
>< Ndell 
>< Mbol 
>< DpnII 
>< Mbolix Dpnl 

>< XmnI >< BspAI> < Eco57I >< Tru9I 

>< Asp700I>< Bspl43I >< Mse i 

GAAGGAGTTC CTGATCTTCT GGTCTAAACG AACTAACTAT T ATT ATT ATT CTGTTTGGAA CTTTAACATT 
26330 26340 26350 26360 26370 26380 26390 

>< ScrFI 
>< Mval 
>< EcoRII 

>< Ecll36I 
>< DsaV NlalV >< 
>< Rsal >< BstOI 

>< Mall >< Tru9I >< BstNI Rmal X 

>< Csp6I >< Msei >< BsiLI Mael >< 

> < Nlalll >< Afal > < Alul >< ApylBscBI >< 

GCTTATCATG GCAGACAACG GTACTATTAC CGTTGAGGAG CTTAAACAAC TCCTGGAACA ATGGAACCTA 
26400 26410 26420 26430 26440 26450 26460 

>< ScrFI 
>< Rmal 

>< Mval 
>< Mael 

>< EcoRII 

>< Ecll36I 
>< DsaV 

>< BstOI 

>< BstNI 

>< BsiLI 

>< Apyl >< Mael II 

GTAATAGGTT TCCTATTCCT AGCCTGGATT ATGTTACTAC AATTTGCCTA TTCTAATCGG AACAGGTTTT 
26470 26480 26490 26500 26510 26520 26530 

>< Pall 
>< Msei 
>< Mnll >< Maelll 
>< Haelll 
>< Eael 
>< BsuRI 
>< BsrI 

>< Rsal >< BspWI 

>< Csp6I >< Hindlll • >< BshI 

>< Afal >< Alul >< Ball >< Bbvl Fnu4HI X 

TGTACATAAT AAAGCTTGTT TTCCTCTGGC TCTTGTGGCC AGTAACACTT GCTTGTTTTG TGCTTGCTGC 
26540 26550 26560 26570 26580 26590 26600 

>< Vspl 
>< Tru9I 

>< Msei >< HphI 

>< Sfcl >< Asnl >< BsrI 

X AccI X Aselx Maelllx Ac±I 
TGTCTACAGA ATTAATTGGG TGACTGGCGG GATTGCGATT GCAATGGCTT GTATTGTAGG CTTGATGTGG 
26610 26620 26630 26640 26650 26660 26670 

X Espl 

X Eco57I 
>< Ddel 

>< Celll >< Rsal 

X Bpull02I >< Csp6I 
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>< Bfrl >< Afal 

>< Alul >< Acil MboII > 

CTTAGCTACT TCGTTGCTTC CTTCAGGCTG TTTGCTCGTA CCCGCTCAAT GTGGTCATTC AACCCAGAAA 

26680 26690 26700 26710 26720 26730 26740 



>< ScrFI 

>< Neil 
>< MSpI 
>< Hpall 
>< HapII 
>< DsaVx Mnll 

>< Bsir 

>< BsiYI 

>< BsaJI >< Muni > < Xcml 

>< Bcnl >< Maelll >< Acil >< Nlalll 

CAAACATTCT TCTCAATGTG CCTCTCCGGG GGACAATTGT GACCAGACCG CTCATGGAAA GTGAACTTGT 
26750 26760 26770 26780 26790 26800 26810 



Tru9I >< 

SinI > 

Sau96I > 

PpuMI > 

NspIV > 
Msel >< 
x MaeHI 

>< Sau3AI > < Rmal X Haell 

>< Ndell >< Pail > < Mael EcoO109I > 

>< Mbol >< Mspl >< HinPlIEco47I > 

>< Fbal >< Hpall >< Styix Hin6I Drall > 

X DpnII >< HapII >< EcoT14I Cfrl3I > 

>< Dpni X Haelll >< Ecol30I>< Bspl43II 

>< BspAI >< Gclill >< BssTlI BsiZI > 

>< Bspl43I >< Eael >< BsaJI Bmel8I > 

>< BsiQI >< BsuRI >< Blnl >< Hhal Avail > 

>< Bell >< MaeHI >< BshI >< Avrll >< Cfol Asul > 
CATTGGTGCT GTGATCATTC GTGGTCACTT GCGAATGGCC GGACACTCCC TAGGGCGCTG TGACATTAAG 
26820 26830 26840 26850 26860 26870 26880 

>< Sau3AI 
>< Ndell 
>< Mbol 
>< DpnII 
>< Dpni 
>< Pssl >< BspMI 
>< Psp5II X BspAI X XmnI 

X NspHII X Bspl43I X Asp700I > < Hgal Fnu4HI >< 

GACCTGCCAA AAGAGATCAC TGTGGCTACA TCACGAACGC TTTCTTATTA CAAATTAGGA GCGTCGCAGC 
26890 26900 26910 26920 26930 - 26940 26950 

>< Tfil 
>< Hinfl 

X Bbvl > < Tru9I 

X Bbvl X Fnu4HI >< Acil > < Msel 

GTGTAGGCAC TGATTCAGGT TTTGCTGCAT ACAACCGCTA CCGTATTGGA AACTATAAAT TAAATACAGA 

26960 26970 26980 26990 27000 27010 27020 



X Mspl >< Rsal 

x Hpall >< Rmal 

>< HapII >< Csp6I 

X CfrlOI >< Maeix Bcgl Hindu x 

>< Bcgl/a X Sspl >< Afal >< Maelll Hindi x 
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CCACGCCGGT AGCAACGACA ATATTGCTTT GCTAGTACAG TAAGTGACAA CAGATGTTTC ATCTTGTTGA 
27030 27040 27050 27060 27070 27080 27090 

>< ScrFI 

>< Mval 
>< Maelll 
>< EcoRII 

>< Ecll36l 
>< DsaV 

>< BstOI 

>< BstNI 

>< BsiLI >< Tfil 

>< Apyl >< Mnll Hinf I >< 

CTTCCAGGTT ACAATAGCAG AGATATTGAT TAT C ATT AT G AGGACTTTCA GGATTGCTAT TTGGAATCTT 
27100 27110 27120 27130 27140 27150 27160 

>< BsmAI >< Tru9I > < Mnll 

>< Maell >< Alw26I >< Msel >< Ddel >< MboII 

GACGTTATAA TAAGTTCAAT AGTGAGACAA TTATTTAAGC CTCTAACTAA GAAGAATTAT TCGGAGTTAG 
27170 27180 27190 27200 27210 27220 27230 

>< Ksp632I 
>< MboII >< Earl 

>< MboII >< NlaIIIEamll04I >< 

ATGATGAAGA ACCTATGGAG TTAGATTATC CATAAAACGA ACATGAAAAT TATTCTCTTC CTGACATTGA 
27240 27250 27260 27270 27280 27290 27300 

> < Rsal >< Rsal 
>< Csp6I >< Csp6I 

> < Alul >< Mnll > < Afal >< Afal 

TTGTATTTAC ATCTTGCGAG CTATATCACT ATCAGGAGTG TGTTAGAGGT ACGACTGTAC TACTAAAAGA 
27310 27320 27330 27340 27350 27360 27370 

>< Mnll >< HphI >< HphI >< Mnll 

ACCTTGCCCA TCAGGAACAT ACGAGGGCAA TTCACCATTT CACCCTCTTG CTGACAATAA ATTTGCACTA 
27380 27390 27400 27410 27420 27430 27440 

Sau3AI > 

> < PvuII 

> < PspSI 

> < NspBII 
>< TthHB8 I Ndell > 
>< TaqI Mbol > 

>< Rsal >< Fnu4HI 

>< Csp6I DpnII > 

>< Rmal >< Bbvl BspAI > 

>< Mael >< Afal > < Alul 

ACTTGCACTA GCACACACTT TGCTTTTGCT TGTGCTGACG GTACTCGACA TACCTATCAG CTGCGTGCAA 
27450 27460 27470 27480 27490 27500 27510 

>< SstI 
>< Sdul 
>< SacI 
>< NspII 
>< HgiAI 
>< Eco24I 

> < EC1136II 

>< BspWI 
>< Bspl286I 
>< Bmyl 

>< HphI >< Banll 

>< Dpnl >< Mnll >< Alw21I 
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>< Bspl43I X Mnll > < Alul Bbvl >< 

GATCAGTTTC ACCAAAACTT TTCATCAGAC AAGAGGAGGT TCAACAAGAG CTCTACTCGC CACTTTTTCT 
27520 27530 27540 275SO 27560 27570 27580 



>< Rmal 
>< Mae I 
>< Fnu4HI 



>< Tru9I 
>< Msel 

>< HphI 



>< Tru9I 
>< Msel 



SstI >< 
Sdul >< 
SacI >< 
NspII >< 
HgiAI >< 
Eco24I >< 
Ecll36II >< 
Bspl286I >< 
Bmyl >< 
Banll >< 
Alw21I >< 
Alul >< 



CATTGTTGCT GCTCTAGTAT TTTTAATACT TTGCTTCACC ATTAAGAGAA AGACAGAATG AATGAGCTCA 
27590 27600 27610 27620 27630 27640 27650 

>< Tru9I >< Tru9I 

>< Msel >< Msel 

CTTTAATTGA CTTCTATTTG TGCTTTTTAG CCTTTCTGCT ATTCCTTGTT TTAATAATGC TT ATT AT ATT 



27660 



27670 



27680 



27690 



27700 



27710 



27720 



>< XhoII 
>< Xbal 

> < ScrFI 

>< Sau3AI 

>< Rmal 
>< Ndell 

> < Mval 

>< Mfll 
>< Mbol 
>< EcoRIlx Mae I 

> < Ecll36I 

x DpnII 

X Dpnl 
>< BstYI 

> < BstOI 

> < BstNI 

X TthHB8 I X BspAI > 
X DsaVx Bspl43I 

> < BsiLI >< 
>< T.aql > < Apyl > < Alwl > 

TTGGTTTTCA CTCGAAATCC AGGATCTAGA AGAACCTTGT 
27730 27740 27750 27760 



< Rsal 
>< Mbol I 
Csp6I 

< Afal x Nlalll 
ACCAAAGTCT AAACGAACAT GAAACTTCTC 

27770 27780 27790 



>< HinPlI 
>< Hin6I 
>< Hhal 
>< Rsal X Haell 
>< Sfcl X Eco47lII 

>< Csp6I>< Cfol SfaNI X 
>< Ndel X Afal X Bspl43II 

ATTGTTTTGA CTTGTATTTC TCTATGCAGT TGCATATGCA CTGTAGTACA GCGCTGTGCA TCTAATAAAC 
27800 27810 27820 27830 27840 27850 27860 

X XhoII 
X Sau3AI 
X Ndell 
> < Mall 

>< Mfll 
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>< Mbol 
>< DpnII 

>< Dpnl 
>< BstYI 
>< NlalllX BspAI 



>< Rsal 
>< Mbol I 

>< Csp6I >< Rmal 
>< Alwl >< Bspl43I >< Afal >< Mael 
CTCATGTGCT TGAAGATCCT TGTAAGGTAC AACACTAGGG GTAATACTTA TAGCACTGCT TGGCTTTGTG 
27870 27880 27890 27900 27910 27920 27930 

>< Sdul 

>< Rmal 
>< NspII 

>< Mael 
>< HgiAI 

>< Bspl286I >< Nspl 

>< Brayl >< NspHI 

>< Alw21I >< Nlalll >< Maelll 

CTCTAGGAAA GGTTTTACCT TTTCATAGAT GGCACACTAT GGTTCAAACA TGCACACCTA AT GT TACT AT 



27940 



27950 



27960 



27970 



27980 



27990 



28000 



> < XhoII 

> < Sau3AI > < Van91I 

>< PvuII 
>< PspSI 

> < Ndell > < PflMI 

> < MfllX NspBII 

> < Dpnl I >< HinPlI 

>< Bspl43I >< Hin6I 

> < BstYI > < BslI >< Hhal 

> < BspAI > < BsiYlX Cfol 
< MbolX AlulX BspWI 



X Riua 
X Mae 
x BspWI 

>< Alwl >< Dpnl > < AccB7I X Alul 

CAACTGTCAA GATCCAGCTG GTGGTGCGCT TATAGCTAGG 



28010 



28020 



28030 



28040 



x Rsal 
X NlalV 

>< Kpnl x Nlalll 
>< Eco64I >< Maelll 

x Csp6I>< HphI 
X BscBI >< Eco0651 

X BanI >< BspHI 
I X Asp718 X Eco91I 

I x Afal X BstPI 

X AccBlI >< BstEII 

X Acc65I X Bbvl 

TGTTGGTACC TTCATGAAGG TCACCAAACT 
28050 28060 28070 



X Fnu4HI 
X Esp3I 
X BsmAI 
>< Alw26I 



>< Rsal 
>< Mae I I 
>< Csp6I 
X BsmBI 
X Afal 



x Tru9I 
>< Msel 
X Dral 



>< Tru9I 
X Msel 



>< SinI 
x Sau96I 
x NspIV 
NspHII X 
NlalV >< 

x Eco4 7I 
X Cfrl3I 
>< BsiZI 
BscBI X 

>< Bmel8I 
>< Avail 
x Asul 



GCTGCATTTA GAGACGTACT TGTTGTTTTA AATAAACGAA CAAATTAAAA TGTCTGATAA TGGACCCCAA 



28080 



28090 



28100 



28110 



28120 



28130 



28140 



>< Maell 



>< Sdul 
x NspII 
>< Bspl286I 
X Bmyl 

X Acil 



x SinI 
x Sau96I 
X NspIV 
X NspHII 

X NlalV 
X Eco4 7I 
x Cfrl3I 
X BsiZI 

X BscBI 
>< Bmel8I 
x Avail X Tfil 
X Asul x Hinfl 



X Mnll 
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TCAAACCAAC GTAGTGCCCC CCGCATTACA TTTGGTGGAC CCACAGATTC AA.CT G AC AAT AACCAGAATG 
28150 28160 28170 28180 28190 28200 28210 

>< HinPlI >< Styl 
>< Haell 

> < Pall >< Hin6I >< EcoT14I 

> < Haelll X HhalX Ecol30I 

>< BspWI >< BssTlI 

> < BsuRI >< Bspl43ir 

>< Hgal> < BshI >< CfoIX BsaJI >< Hgal 

GAGGACGCAA TGGGGCAAGG CCAAAACAGC GCCGACCCCA AGGTTTACCC AAT AAT AC TG CGTCTTGGTT 
28220 28230 28240 28250 28260 28270 28280 

X TthHB8 I 

> < ScrFI 
X Pall 

x PaeR7I 
>< NspIII 

> < Mval 
x Haelll 
X EcoRII 

X Eco88I 

>< Xhol > < Ecll36I 
>< DsaV 
X BsuRI 
>< Slal > < BstOI 
X Mnllx Taql> < BstNI 
>< Ccrl > < BsiLI 
X Hinfl >< BshI 

>< Tfiix Bcoix BsaJI 
>< Mnll >< Ddel X Aval > < Apyl 

X Alul >< Ddel > < Nlalll X Bfrl X Ama87I X Mnll 
CACAGCTCTC ACTCAGCATG GCAAGGAGGA ACTTAGATTC CCTCGAGGCC AGGGCGTTCC AATCAACACC 
28290 28300 28310 28320 28330 28340 28350 

>< SinI 
X Sau96I 
X NspIV 

X NspHII 
X Eco4 7I 
X Cfrl3I 
X BsiZI 

>< Bmel8I > < Ksp632I 

>< Avail > < Eamll04I 

>< Asul > < Earl > < AluIX Mbol I x Maelll 

AATAGTGGTC CAGATGACCA AATTGGCTAC TACCGAAGAG CTACCCGACG AGTTCGTGGT GGTGACGGCA 
28360 28370 28380 28390 28400 28410 28420 

>< Ssfcl 
x Sdul 
>< Sad 
>< NspII 
X HgiAI 
X Espl 

X Eco24I X Sau96I 

X Ecll36II >< Styl >< Pall 

x Ddel >< Rmal X NspIV 

>< Celll x Mael >< Haelll 

X Bspl286I >< EcoT14I >< Cfrl3I 

X Bpull02I X Ecol30X >< BsuRI 

X Bmyl >< BssTlI > < BsrI 

X Banll x Rsal X BsaJI >< BsiZI 
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X Alw21I >< Csp6I >< Blnl >< BshlX Hindlll 

>< HphI x Alul >< Afal x Avrll X Asul x Alul 

AAATGAAAGA GCTCAGCCCC AGATGGTACT TCTATTACCT AGGAACTGGC CCAGAAGCTT CACTTCCCTA 
28430 28440 28450 28460 28470 28480 28490 

X HinPlI 
>< Hin6I 
X Hhal 
X Haell 

><c Cfo1 > < Mnll x NlalV 

X Bspl43II >< SfaNI X Ddel X BscBI 

CGGCGCTAAC AAAGAAGGCA TCGTATGGGT TGCAACTGAG GGAGCCT TG A ATACACCCAA AGACCACATT 
28500 28510 28520 28530 28540 28550 28560 

>< NlalV 
X Eco64I 

X BscBI 
X BanI 

>< Acil 

>< AccBlI >< Bbvl x Fnu4HI >< Mnlr 

GGCACCCGCA ATCCTAATAA CAATGCTGCC ACCGTGCTAC AACTTCCTCA AGGAACAACA TTGCCAAAAG 
28570 28580 28590 28600 28610 28620 28630 

>< Thai 
>< Mnll 
>< Maell x Mvnl 
>< Mnll BstOI x 

X Fnu4HI >< Ksp632I BspSOT X 

- ><: Bs P WI >< Earl x BsaAlx Acil 

x Mnll x Mnll x Acilx MboII x Eamll04I AccII x 

GCTTCTACGC AGAGGGAAGC AGAGGCGGCA GTCAAGCCTC TTCTCGCTCC TCATCACGTA GTCGCGGTAA 
28640 28650 28660 28670 28680 28690 28700 

X ScrFI 
X Mval 

X EcoRII >< TthHB8I 

X EC1136I >< BmAl 

X DsaVX Fnu4HI >< NheI 

x BstOI * >< MniI 

>< BstNI >< MaeI 

X BsiLI > < BspWI 

X Apyl x Bbvl >< Taql >< Acil 

TTCAAGAAAT TCAACTCCTG GCAGCAGTAG GGGAAATTCT CCTGCTCGAA TGGCTAGCGG AGGTGGTGAA 

28710 28720 28730 28740 28750 28760 28770 

> < Thai 

> < Mvnl 

X HphI X Mnll 

> < HinPlI 

> < Hin6I 

>< Hhal 

> < BstUI x Rmal PalI ><c 

> < BspSOI X Mael HaeIII >K 
X Bbvl X CfolX Fnu4HI BsuRI >K 

> < AccIIX BspWI - >< Alul BshI X 
ACTGCCCTCG CGCTATTGCT GCTAGACAGA TTGAACCAGC TTGAGAGCAA AGTTTCTGGT AAAGGCCAAC 

28780 28790 28800 28810 28820 28830 28840 



> < Palix Maelll 



Rsal x 

. , TTT >< Mnll 

> < HaeIII >< Fnu4HI Maell >< 

> < BsuRI x Ddel x Ddel Csp6I X 
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> < BshI > < Bbvl >< Mnll >< BspWI >< SfaNI Afal >< 

AACAACAAGG CCAAACTGTC ACTAAGAAAT CTGCTGCTGA GGCATCTAAA AAGCCTCGCC AAAAACGTAC 



28850 



28860 



28870 



28880 



28890 



28900 



28910 



>< Tthllll 
>< SinI 
>< Sau96I 
>< NspIV 
>< NspHII 
> < Maell 

>< Eco47I 
>< Cfrl3I 
>< BsmBI 
>< BsiZI 
>< Bmel8I 
>< Avail 
>< Asul 
Aspl 



>< Styl 
>< EcoT14I 
>< Ecol30I 
>< BssXIT 
>< BsaCTI 



>< Rsal 

>< Maelll 
>< Maell >< Esp3I 

>< Csp6I >< BsmAI 

>< Afal >< Alw26I> < 

TGCCACAAAA CAGTACAACG TCACTCAAGC ATTTGGGAGA CGTGGTCCAG AACAAACCCA AGGAAATTTC 
28920 28930 28940 28950 28960 28970 28980 

>< SinI 
>< Sau96I 
>< NspIV 

>< NspHII 
^ >< NIalV 
X Eco4 7I 
>< Cfrl3I 
>< BsiZI 

>< BscBI 
>< Bmel8l 
>< Avail 
>< Asul 



>< Pall 
>< Haelll 
>< Gdill 

>< Pnu4HI 
>< Eael 
>< BsuRI 
>< BshI 
>< Acil 



>< 



BspWI 
BspWI 



GGGGACCAAG ACCTAATCAG ACAAGGAACT GATTACAAAC ATTGGCCGCA AATTGCACAA TTT GCTCCAA 
28990 29000 29010 29020 29030 29040 29050 

>< Bsml >< Nlalll 

>< BscCI >< Mnll >< Maelll >< Maelll >< Nlalll 

GTGCCTCTGC ATTCTTTGGA ATGTCACGCA TTGGCATGGA AGTCACACCT TCGGGAACAT GGCTGACTTA 



29060 



29070 



29080 



29090 



29100 



29110 



29120 



>< XhoII 
>< Sau3AI 
X Ndell 
>< Mfll 
>< Mbol 

>< Fokl 
Tru9I x DpnII 

> < Dpnl 
X BstYI 
Msel x BspAI 

X BstXlX Alwl> < Bspl43I >< Aspl BspWI >< 

TCATGGAGCC ATTAAATTGG ATGACAAAGA TCCACAATTC AAAGACAACG TCATACTGCT GAACAAGCAC 
29130 29140 29150 29160 29170 29180 29190 



X 

X NlalV 
>< Nlalll 

X 

X BscBI 



X Tthllll 
X Maell 
>< Aspl 



Espl X 
Ddel X 
CeJLII >< 
Bpull02I x 

>< Hgal AluI >< 

ATTGACGCAT AC AAAAC AT T CCCACCAACA GAGCCTAAAA AGGACAAAAA GAAAAAGACT GATGAAGCTC 
29200 29210 29220 29230 29240 29250 29260 
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>< Plel 

>< MfooII 
X MboII 
>< Maelll 



>< Fnu4HI 
>< BspWI 
>< BsraAI 
>< Alw26I 

>< Acil >< Fnu4HI >< Bbvl 

AGCCTTTGCC GCAGAGACAA AAGAAGCAGC CCACTGTGAC TCTTCTTCCT GCGGCTGACA T GG AT GAT TT 
29270 29280 29290 29300 29310 29320 29330 



>< Ksp632I >< Gsul 
>< Earix Fnu4HI 
>< Hinfl >< Eamll04I>< Bpral 

>< Acil >< Nlalll 



>< Nlalll >< Hinfl Nlalll >< 

X Fokl >< Alul >< TfilX Ddel >< BspHI 

CTCCAGACAA CTTCAAAATT CCATGAGTGG AGCTTCTGCT GATTCAACTC AGGCATAAAC ACTCATGATG 
29340 29350 29360 29370 29380 29390 29400 

>< Mae I I >< AccI 

ACCACACAAG GCAGATGGGC TATGTAAACG TTTTCGCAAT TCCGTTTACG ATACATAGTC TACTCTTGTG 
29410 29420 29430 29440 29450 29460 29470 

>< Tru9I 
>< Tru9I 

>< Msel 
>< Msel 

>< XmnI >< Hpal 

>< EcoRIx Maelll >< Hindll Tru9I >< 

>< Asp700I >< Bsgl >< Hindi Msel >< 

CAGAATGAAT TCTCGTAACT AAACAGCACA AGTAGGTTTA GTTAACTTTA ATCT C AC ATA GCAATCTTTA 
29480 29490 29500 29510 29520 29530 29540 



Xorll > 
TthHB8 I > 
TaqI >. 
Sau3AI >< 
Rsal >< 
>< ThalPvuI > 
Ndell >< 
>< Mnll 
>< MvnIMcrl > 
Mbol >< 
DpnII >< 
Dpnl >< 
Csp6I >< 
X BstUI 
X Haelll BspCI > 
BspAI X 
X TthHB8 I X Bsp50I 

>< Pall Bspl43I X 
X BsuRI BsiEI > 
X BshlAfal >< 

>< Mnll >< TaqI >< Acil 

X Maelll X Mnll >< AccII 

ATCAATGTGT AACATTAGGG AGGACTTGAA AGAGCCACCA CATTTTCATC GAGGCCACGC GGAGTACGAT 



29550 



29560 



29570 



29580 



29590 



29600 



29610 



X Rsal 
x Csp6I 
X Afal 



X Rmal 
>< Mael 
x Bbvl 



X Ksp632I 
X Fnu4HI 

x Earl 
< AluIX Eamll04I 



X Sdul 
X NspII 

X MboII 
X Eco24I 
X Bspl286I 
>< Bmyl 
>< Banll 



X Vspl 
>< Tru9I 
X Msel 
>< Asnl 
X Asel 
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CGAGGGTACA GTGAATAATG CTAGGGAGAG CTGCCTATAT GGAAGAGCCC TAATGTGTAA AATTAATTTT 
29620 29630 29640 29650 29660 29670 29680 

>< Tru9I >< Ddel 
>< Msel >< Bfrl 
>< Nlalll > < Alul 
AGTAGTGCTA TCCCCATGTG ATTTTAATAG CTTCTTAGGA GAATGACAAA AAAAAAAAAA AAAAAA 
29690 29700 29710 29720 29730 29740 
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1-3059 1 CTCTT CTGG AAAAAGGT AGGCTT ATCATTAGAG AAAACAAC AGAGTTGTGGTTTCAAGTG 

S-040530 



1-3059 61 ATATTCTTGTTAACAACTAAACGAACATGTTTATTTTCTTATTATTTCTTACTCTCACTA 

S— 040530 1 GG"T"C"C" " " " " "C" "C" " "C"GC"G" "C" "G" "C" "G" ,f C" 



1-3059 121 GTGGT AGTG ACCTTGACCGGTGCACCACTTTTGATGATGTTCAAGCTCCT AATTACACTC 

S— 040530 4 4 "C" "C" "C" 11 " " "G" " " " " 11 " " " M " " " "C" "C" "C" "C" "G" "G" "C" "C" "C" " " " "C" 

1-3059 181 AACATACTT_CATCTATGAGGGGGGTTTACTATCCTGATGAAATTTTTAGATCAGACACT 

S-040530 104 "G" "C M "CAG" "G" "C" " " "C" "G" " nnn Q n "C" "C" "G'^'C" ""C"GAGC" ""C 

1-3059 240 CTTTATTTAACTCAGGATTTATTTCTTCCATTTTATTCTAATGTTACAGGGTTTCATACT 

S-040530 163 " "G" "CC'G" "C" M " " "CC"G" "C""G" "C" "C" "CAGC" "C" "G" "C" "C" "C" "C""C 

1-3059 300 ATT AATC AT ACGTTTGGCAACCCTGTCAT ACCTTTTAAGGATGGTATTTATTTTGCTGCC 

S-040530 223 " "C" "C" "C" "C" "C" " " " " " " "C" "G" "C" "C" "C" M " " "C" "C" "C" "C" "C" "C" " " 

1-3059 360 ACAGAGAAATCAAATGTTGTCCGTGGTTGGGTTTTTGGTTCT ACCATGAACAACAAGTCA 

S-040530 283 »"C" " "GAGC" "c""G""G" "G" "C" " " ,,,f G" "C" "CAGC" " " " " " """ " " " " ""AGC 

1-3059 420 CAGTCGGTGATT AT TATT AAC AATTCTACTAATGTTGTT ATACGAGCATGT AACTTTGAA 

S— 040530 34 3 " " "AGC"" " " "C" M C ,n, C"" " " "CAGC" "C" "C" "G" "G" "C" "G" "C" "C" " " " "C" "G 

1-3059 480 TTGTGTGACAACCCTTTCTTTGCTGTTTCTAAACCCATGGGTACACAGACACATACTATG 

S-040530 403 C" " " "C"" " " " " ""C" " " " "C" "C""G" "C" " " "" " " " " " "C" "C" " " M "C" "C" "C" " " 

1-3059 540 AT ATTCGATAATGCATTT AATTGCACTTTCGAGT ACAT ATCTG ATGCCTTTTCGCTTGAT 

S-040530 4 63 " "C" " " " "C" "C" "C" "C" "C" " " " "C" " " " " " " " " " "CAGC" "C" " " " "CAGC" "G" "C 

1-3059 600 GTTTC AGAAAAGTC AGGTAATTTT AAAC ACTT ACG AGAGTTTGTGTTTAAAAAT AAAGAT 

S-04 0530 523 " "GAGC" "G" ""AGC" "C" "C" "C" "G" " "C"G" "G" " " " "C" " " " "C""G" "C""G" "C 

1-3059 660 GGGTTTCTCT ATGTTTATAAGGGCTATCAACCT ATAGATGTAGTTCGTGATCTACCTTCT 

S-04 0530 58 3 " "C" "C" "G" "C" "G""C" " " " """ "C""G" "C" "C" "C" "G" "GA"A" "C" "G" "CAGC 

1-3059 720 GGTTTT AACACTTTGAAACCT ATTTTT AAGTTGCCTCTTGGT ATTAACATT ACAAATTTT 

S— 04 0530 64 3 " "C" "C" " " " "CC" " " "G" "C" "C" "C" " "C" " " "C" "G" "C" "C" " " " "C" "C" "C" "C 

1-3059 780 AGAGCCATTCTTACAGCCTTTTCACCTGCTCAAGACATTTGGGGC ACGTCAGCTGCAGCC 

S-04 0530 703 C"G" " " " "C" "G" "C"" " """AGC" "" " "C" "G"" "" "C" "" " "" " "CAGC""C" "C" " " 

1-3059 840 T ATTTTGTTGGCTATTTAAAGCCAACTACATTTATGCTCAAGTATGATGAAAATGGTACA 

S-04 0530 7 63 " "C" "C" "G" " " " "CC"G" " " " "T""C""C""C" " " " "G"" " " "C""C" "G" "C" "C""C 

1-3059 900 ATCAC AGATGCTGTTG ATTGTTCTCAAAATCC ACTTGCTGAACTCAAATGCTCTGTTAAG 

S-04 0530 823 ""•••"•C" "C" "C" "G""C" "CAGC" "G""C""C" "G" "C""G" "G""G" ""AGC" "G"" " 

1-3059 960 AGCTTTGAGATTGACAAAGGAATTTACCAGACCTCTAATTTCAGGGTTGTTCCCTCAGGA 

S-04 0530 883 "" " " "C"" " " "C" " " ""G" "C" "G" " "" "" " " "AGC" "c"" " " "A" "G" "G""TAGC" "C 

1-3059 1020 GATGTTGTGAGATTCCCTAATATT ACA/VACTTGTGTCCTTTTGGAGAGGTTTTTAATGCT 

S-040530 943 " " " " "G" " "C"G" " " " "C" " " " "C" "C" " "C" " " "C" "C" "C" "C" "A" "G" "C" "C" "C 

1-3059 1080 ACTAAATTCCCTTCTGTCTATGCATGGGAGAGAAAAAAAATTTCTAATTGTGTTGCTGAT 

S-040530 1003 " "C" "G" " " " "CAGC""G""C" "C" " """ "C"G" "G" "G""CAGC""C" "C""G" "C" "C 

1-3059 1140 TACTCTGTGCTCTACAACTCAACATTTTTTTCAACCTTTAAGTGCTATGGCGTTTCTGCC 

S-040530 1063 " " "AGC" " "" "G" " " " " " " "C" "C" "C" "CAGC" " " " "C" " " " " " " "C" " "" "GAGC" "" 

1-3059 1200 ACTAAGTTGAATGATCTTTGCTTCTCCAATGTCTATGCAGATTCTTTTGTAGTCAAGGGA 

S-04 0530 1123 " "C" " "C" " " "C" "C" "G" " " " " "AG"" "C" "G" "C" "C""CAGC" "C" "G" "G" " " " "C 

1-3059 1260 GATG ATGT AAG AC AAAT AGCGCCAGG ACAAACTGGTGTT ATTGCTGATTAT AATT AT AAA 

S-04 0530 1183 " "C" ,, C" "G" " " " "G" "C" "C" "T" "C""G""C" "c""G""C" "C" "C" "C" "C" "C" "G 
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1-3059 1320 T TGCCAGATGATTTCATGGGTTGTGT CCTTGCTTGGAAT ACTAGGAACATTGATGCT ACT 

S— 040530 124 3 C" M " "C" "C" "C" " " " " " " "C" "C" "G" "G" "C" " M " "C" "CC" M " 11 " " "C" "C" "C" "A 

1-3059 1380 T C AACTGGTAATT AT AATT ATAAAT AT AGGT ATCTTAGAC ATGGC AAG CTT AGGCCCTTT 

S—04 0530 1303 AGC" "C" "C" "C" "C" " " 11 "C" "G" "CC"C" "C" "GC"G" M C" 11 " M 11 " " "GC" M " " " " "C 

1-3059 1440 GAG AGAG ACAT ATCTAATGTGCCTTTCTCCCCTG ATGGC AAACCTTGCACCCCACCTGCT 

S — 0 4 0 5 3 0 1363 " M Q 11 Q •■■•»••» n q it n q " »» q ii m •• h ii £■ ti tt ii pjQ it if ii qii iiq ii ii ii ii ii qii iiq ii ti 1 1 ii ii it it ti q it it it ft ti q 

1-3059 1500 CTTAATTGTT ATTGGCC ATTAAATGATT ATGGTTTTT ACACC ACT ACTGGC ATTGGCT AC 

S— 04 0530 1423 " "G" "C" "C" "C" 11 M " M CC"G" "C" "C" "C" "C" "C" " " " M M " "C" 11 C" ,r " " "C" " 11 M "T 

1-3059 1560 C AACCTT AC AG AGTTGT AGTACTTTCTTTTG AACTTTTAAATGCACCGGCC ACGGTTTGT 

S— 04 0530 14 83 " "G M "C" " " M " " " "G" "G" "G" "GAGC" "C" "G" "GC"G" "C" "C" "T " 11 " 11 "C" "G" "C 

1-3059 1620 GG ACCAAAATT ATCC ACT G AC CTT ATT AAG AAC CAGTGTGTC AATTTT AATTTT AATGG A 

S— 040530 1543 " "C" "C" "GC"GAG" " "C" " " " r, G" "C" 11 " 11 " M " M M " "C" "G" "C""C" "C" "C" "C" "C 

1-3059 1680 CTC ACTGGT ACTGGTGTGTT AACTCCTTCTTCA_AAG AGATTTCAACC ATTT CAAC AAT 

S-04 0530 1603 " "G" "C" »«c""C" "C"" "C"G" "C" " ,, AG""GC"""C"C""C" "G" "C""C" "G""G" 

1-3059 1738 TTGGCCGTGATGTCTCTGATTTCACTG ATTCCGTTCGAG ATCCT AAAAC ATCTGAAAT AT 

S-040530 1661 "C" " " " "G" " " " "GAGC" "C" " " " "C" "CAG" " "G" "G" "C" "C" "G" "CAGC" f, G" ,f CC 

1-3059 17 98 TAGACATTTCACCTTGCTCTTTTGGGGGTGTAAGTGTAATTACACCTGGAACAAATGCTT 

S-040530 1721 "G" " « » "CAGC" M C" " "AGC" "C" "C" "C" "GTCC" "G" "C" "C" "C" "C" "C" "C" "CA 

1-3059 1858 __CATCTGAAGTTGCTGTTCT AT ATCAAGATGTT AACTGCACTGATGTTT CT ACAGC AATC 

S — 0 4 0 5 3 0 1781 G " " G " " " " " " G " " C " " G " " G " " C " " G ,T " C " " G " " " " " " " " C " " C M " GAGC " " C " " C " " " 

1-3059 1917 CATGC AG AT C AACTC ACACCAGCTTGGCGCAT ATATT CT ACTGG AAACAATGTATTCCAG 

S— 04 0530 1840 " " C C " " C G G " " C " " C " " C " " " 11 "G" "C" "CAGC" "C" "G" M " " "C" "G" " MM 

1-3059 1977 ACTCAAGCAGGCTGTCTTATAGGAGCTGAGCATGTCGACACTTCTTATGAGTGCGACATT 

S — 0 4 0 5 3 0 1900 " " C " " G M " C M n " H " c nu G 11 " C" " C " "C M " " M " C ** " G " M M 11 " CAGC " " C " ,f " " " " " " " " " C 

1-3059 2037 C CT AT TGGAGCTGGC ATTTGTGCT AGTT ACCAT ACAGTTTCTTT ATT ACGT AGT ACT AGC 

S— 040530 1 960 " "c" " " " "C" "C M "A" "C" "C M "C" "C" " " " " C" "C" ,, GAGCC ,, GC ,, G , ' "G" "C" "C" " " 

1-3059 2097 CAAAAATCTATTGT GGCTTAT ACTATGTCTTT AGGT GCTGAT AGTT CAATTGCTTACTCT 

S-04 0530 2020 " "G" "G" "C" "C" " " " "C" "C" "C" " "AGCC"G" "C" "C" "C" "CAGC" "C" "C" " "AGC 

1-3059 2157 AAT AACACC ATTGCT AT ACCT ACTAACTTTTCAATT AGCATT ACT ACAG AAGTAATGCCT 

S— 04 0530 2080 ,f "C" " " " " "C""C" M C" "C" "C" nnn "CAGC" "CTC" " f, C""C" "C" " " " "G" " " " "C 

1-3059 2217 GTTTCT AT GGCT AAAAC CTCCGT AGATTGT AAT ATGTACATCTGCGG AGATTCT ACTGAA 

S—04 0530 2140 ,f "GAGC " " " " "C" "G" "AAG" " "G" " " " "C" "C" " " " " " " " " " " " " "C" "CAGC" "C" "G 

1-3059 2277 TGTGCTAATTTGCTTCTCCAATATGGTAGCTTTTGCACACAACTAAATCGTGCACTCTCA 

S-04 0530 2200 " "C""C" "CC""""G""G""G""C""C"""""C"""""C""G""G""C""G""C""GAGC 

1-3059 2337 GGTATTGCTGCTGAACAGGATCGCAACACACGTGAAGTGTTCGCTCAAGTCAAACAAATG 

S — 0 4 0 530 22 60 " "C" "C " ,, C" "C " "G" " " " "C" "G " " " " "CA"A" " " " " " " " 11 " "C" " " " "G" "G " "G" " " 

1-3059 2397 T ACAAAACCCCAACTTTGAAATATTTTGGTGGTTTTAATTTTTCACAAATATTACCTGAC 

S— 04 0530 2320 " »"p»' «q" »» » « "Q" "qq" " " "Q'* 11 Q 11 11 C" "G" "C" "C" "C" "C" "t" "G" "CC"G" "C" ,f " 

1-3059 24 57 CCTCTAAAGCCAACTAAGAGGTCTTTTATTGAGGACTTGCTCTTTAATAAGGTGACACTC 

S— 04 0530 2380 " " " " "G" " " " "C" "C " " "C"C" "C" "C" "C" " " " " "C" " " "G" "C" "C" "A" " " " "C" "G 

1-3059 2517 G CTGATGCTGGCTTCATGAAGCAATATGGCGAATGCCTAGGTGATATTAATGCT AGAGAT 

S— 04 0530 24 40 " "C" "C" "C" " " " "T" " " " " " " "G" "C" " " " "G" " " " "G" "C" "C" "C" "C" "CC"G" "C 

1-3059 2577 CTCATTTGTGCGCAGAAGTTCAATGGGCTT AC AGTGTTGCCACCTCTGCTC ACTGATGAT 

S— 04 0530 2500 " " G ,MI C " " C C 11 " " M " 11 " "T " "C" " " " "G" "C" " "C" "" "C" "C" " " " "G" "C" "C" "C 

1-3059 2637 ATGATTGCTGCCTACACTGCTGCTCT AGTT AGTGGTACTGCCACTGCTGGATGGACATTT 

S— 04 0530 25 60 " " " " "C" "C" " " " "T 11 "A" "C " "C" "G " "G" "C" "C" "C" " " " "C" "C" " C " " " " "C" "C 
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1-3059 2697 GGTGCTGGCGCTGCTCTTCAAATACCTTTTGCTATGCAAATGGCATATAGGTTCAATGGC 

S— 04 0530 2620 " "A 11 11 C" "A" "C" " C" "G" "G" "C" "C " "C" "C" " " " "G" ,f ,f 11 "C" M CC n " " " M " "C" " " 

1-3059 2757 ATTGGAGTTACCCAAAATGTTCTCTATGAGAACCAAAAACAAATCGCCAACCAATTTAAC 

S— 040530 2680 11 "C" ,f C""G" ,f " " "G" "C" "G" ,, G""C ,, " "G" "G" "G" " " " " "" " "" "G" "C" " " 

1-3059 2817 AAGGCGATTAGTCAAATTCAAGAATCACTTACAACAACATCAACTGCATTGGGCAAGCTG 

S-04 0530 2740 " " " " "C" "C w " C" "G M "C" "G" " GAGC" "G" "C" M " " "CAGC" "C" "CC" " " " " " " " " " " 

1-3059 2877 CAAGACGTTGTTAACCAGAATGCTCAAGCATTAAACACACTTGTTAAACAACTTAGCTCT 

S— 04 0530 2800 " "G" "" 11 "G" ,f G" 11 " " M " " "C" "C" "G" "CC"G" " " " "C" "G" ,, G ,, "G" "G" "G" " "AGC 

1-3059 2937 AATTTTGGTGCAATTTCAAGTGTGCTAAATGATATCCTTTCGCGACTTGATAAAGTCGAG 

S-04 0530 2860 " "C" "C" "C" "C" "CAGCTC" " " " " "G" "C" "C" " " " n GAGCA"G" "G" "C" " " " "G" " " 

1-3059 2997 GCGGAGGTACAAATTGACAGGCTAATTACAGGCAGACTTCAAAGCCTTCAAACCTATGTA 

S-04 0530 2920 ""C" "A""G" "G" "C" ""C" "" "G""C""C" "AC'C" "G" "GTC" ""G" "G" " "" "C""G 

1-3059 3057 ACACAACAACT AATCAGGGCTGCTGAAATCAGGGCTTCTGCTAATCTTGCTGCTACTAAA 

S-04 0530 2980 »"c""G""G" "G" " nn "A" l, C""C""G ,MI,, C n """CAGC""C" " """G" "C""C" "C""G 

1-3059 3117 ATGTCTGAGTGTGTTCTTGGACAATCAAAAAGAGTTGACTTTTGTGGAAAGGGCTACCAC 

S— 04 0530 3040 " " " AGC" 11 " " " C" "G" 11 G" "C" "GAGC" "G" " " " "G" " " " "C " "C" "C" " " " " " " "T" " ,f 

1-3059 3177 CTTATGTCCTT CCCACAAGCAGCCCCGCATGGTGTTGTCTTCCTACATGTCACGTATGTG 

S— 04 0530 3100 M "G" 11 "AG 11 " " " " "C" "G" "C" " " " "C" "C" "C" "G" "G" " " " " G ft "C" "G" ,, C" "C" " " 

1-3059 3237 CC ATCCCAGG AGAGGAACTTC ACC AC AGCGCCAGCAATTTGTCATGAAGGC AAAGC AT AC 

S — 040530 3160 " " TAG" " " 11 " ** " C " " " " " " " " " 11 " " "C" "C" 11 " " "C" "C" 11 C" " C " 11 G" " " " "G" "C" " " 

1-3059 3297 TTCCCTCGTGAAGGTGTTTTTGTGTTTAATGGCACTTCTTGGTTTATTACACAGAGGAAC 

S— 04 0530 3220 " " " " "C" "G" " G" "C" "G" "C" " " " " " " "C" 11 " " "CAGC" " " " "C" "C" "C" " "C"C" " " 

1-3059 3357 TTCTTTTCTCCACAAATAATTACTACAG ACAATACATTTGTCTCAGGAAATTGTGATGTC 

S— 040530 3280 " " " " "CAGC 11 "C" "G" "C" " C" "C" " " " " 11 " "C" "C" 11 C 11 "G" "C" "C" "C" " 11 " " 11 11 " G 

1-3059 3417 GTTATTGGCATCATTAACAACACAGTTTATGATCCTCTGCAACCTGAGCTTGACTCATTC 

S-040530 3340 " "G" "C" 11 " " f * " " ,, C ,, "T" " " " " C" "G " "C" "C" " C" 11 " " "G" " C" " " " "G" 11 f ' AGC 11 " " 

1-3059 3477 AAAGAAGAGCTGGACAAGTACTTCAAAAATCATACATCACCAGATGTTGATCTTGGCGAC 

S— 040530 3400 " "G" "G" " " " " " " " " " "A" " " " " " " "G" "C" "C" "C" "C" "C" "C" "G" "C" "G" " " " "T 

1-3059 3537 ATTTCAGGCATTAACGCTTCTGTCGTCAACATTCAAAAAGAAATTGACCGCCTCAATGAG 

S-04 0530 34 60 " "CAGC"""" "C" «»'»»c""C""G""G"""""C""G""G""G" "C" " "A"A" "G" "C""A 

1-3059 3597 GTCGCTAAAAATTTAAATGAATCACTCATTGACCTTCAAG AATTGGGAAAATATGAGCAA 

S-040530 3520 "»G ,t "C ,, "G" ,, CC"G""C" "GAGC""G""C""" " "G""G""GC" " " "C" "G" "C" " " ""G 

1-3059 3657 TATATTAAATGGCCTTGGTATGTTTGGCTCGGCTTCATTGCTGGACTAATTGCCATCGTC 

S — 0 4 0 5 3 0 3580 " " C " " C " " G " M " * * ,f C 11 " 11 M 11 q " ,f g 11 " " " " G " ,f " " " " " " C " " C " 11 C " " G 11 11 C " 11 " " " " " " G 

1-3059 3717 ATGGTTACAATCTTGCTTTGTTGCATGACTAGTTGTTGCAGTTGCCTCAAGGGTGCATGC 

S— 04 0530 364 0 "'»•*" »g u "C" "* "C """ ,f G " "C" "" " " " u "C" " C " 11 C" "T " "C" " " " "G" "A" "C " "C" " " 

1-3059 3777 TCTTGTGGTT CTTGCTGC AAGTTTGATGAGGATGACTCTGAGCC AGTTCTCAAGGGTGTC 

S— 040530 3700 AGC" " " " "CAGC " " " " 11 " 11 " " " " C " "C" " " " "C" " " AGC " " " " "C" "G T ' ,f G " " " " "C" "G 

1-3059 3837 AAATTACATTACACATAAACGAACTTATGGATTTGTTTATGAGATTTTTTACTCTTGGAT 

S-040530 3760 «»GC"G""C" ,f """C"G " T " " " " CGA " 

1-3059 3897 C AATTACTGC AC AGCC AGT AAAAATTG ACAATGCTT CTCCTGC AAGT 

S-040530 
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ttgagctggt 


tgcagaaatg 


540 


gacggcattc 


agtacggtcg 


tagcggtata acactgggag 


tactcgtgcc 


acatgtgggc 


600 


gaaaccccaa 


ttgcataccg 


caatgttctt 


cttcgtaaga acggtaataa 


gggagccggt 


660 


ggtcatagct 


atggcatcga 


tctaaagtct 


tatgacttag 


gtgacgagct 


tggcactgat 


720 


cccattgaag 


attatgaaca 


aaactggaac 


actaagcatg 


gcagtggtgc 


actccgtgaa 


780 


ctcactcgtg 


agctcaatgg 


aggtgcagtc 


actcgctatg 


tcgacaacaa 


tttctgtggc 


840 


ccagatgggt 


accctcttga 


ttgcatcaaa gattttctcg 


cacgcgcggg 


caagtcaatg 


900 


tgcactcttt 


ccgaacaact 


tgattacatc gagtcgaaga gaggtgtcta 


ctgctgccgt 


960 


gaccatgagc 


atgaaattgc 


ctggttcact 


gagcgctctg 


ataagagcta 


cgagcaccag 


1020 


acacccttcg 


aaattaagag 


tgccaagaaa tttgacactt tcaaagggga 


atgcccaaag 


1080 


tttgtgtttc 


ctcttaactc 


aaaagtcaaa gtcattcaac 


cacgtgttga 


aaagaaaaag 


1140 


actgagggtt 


tcatggggcg 


tatacgctct 


gtgtaccctg 


ttgcatctcc 


acaggagtgt 


1200 


aacaatatgc 


acttgtctac 


cttgatgaaa tgtaatcatt gcgatgaagt 


ttcatggcag 


1260 


acgtgcgact 


ttctgaaagc 


cacttgtgaa 


cattgtggca 


ctgaaaattt 


agttattgaa 


1320 


ggacctacta 


catgtgggta 


cctacctact 


aatgctgtag 


tgaaaatgcc 


atgtcctgcc 


1380 


tgtcaagacc 


cagagattgg 


acctgagcat 


agtgttgcag 


attatcacaa 


ccactcaaac 


1440 


attgaaactc 


gactccgcaa 


gggaggtagg 


actagatgtt 


ttggaggctg 


tgtgtttgcc 


1500 


tatgttggct 


gctataataa 


gcgtgcctac 


tgggttcctc 


gtgctagtgc 


tgatattggc 


1560 
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tcaggccata ctggcattac tggtgacaat gtggagacct tgaatgagga tctccttgag 1620 

atactgagtc gtgaacgtgt taacattaac attgttggcg attttcattt gaatgaagag 1680 

gttgccatca ttttggcatc tttctctgct tctacaagtg cctttattga cactataaag 1740 

agtcttgatt acaagtcttt caaaaccatt gttgagtcct gcggtaacta taaagttacc 1800 

aagggaaagc ccgtaaaagg tgcttggaac attggacaac agagatcagt tttaacacca 1860 

ctgtgtggtt ttccctcaca ggctgctggt gttatcagat caatttttgc gcgcacactt 1920 

gatgcagcaa accactcaat tcctgatttg caaagagcag ctgtcaccat acttgatggt 1980 

atttctgaac agtcattacg tcttgtcgac gccatggttt atacttcaga cctgctcacc 2040 

aacagtgtca ttattatggc atatgtaact ggtggtcttg tacaacagac ttctcagtgg 2100 

ttgtxtaatc ttttgggcac tactgttgaa aaactcaggc ctatctttga atggattgag 2160 

gcgaaactta gtgcaggagt tgaatttctc aaggatgctt gggagattct caaatttctc 2220 

attacaggtg tttttgacat cgtcaagggt caaatacagg ttgcttcaga taacatcaag 2280 

gattgtgtaa aatgcttcat tgatgttgtt aacaaggcac tcgaaatgtg cattgatcaa 2340 

gtcactatcg ctggcgcaaa gttgcgatca ctcaacttag gtgaagtctt catcgctcaa 2400 

agcaagggac tttaccgtca gtgtatacgt ggcaaggagc agctgcaact actcatgcct 2460 

cttaaggcac caaaagaagt aacctttctt gaaggtgatt cacatgacac agtacttacc 2520 

tctgaggagg ttgttctcaa gaacggtgaa ctcgaagcac tcgagacgcc cgttgatagc 2580 

ttcacaaatg gagctatcgt tggcacacca gtctgtgtaa atggcctcat gctcttagag 2640 

attaaggaca aagaacaata ctgcgcattg tctcctggtt tactggctac aaacaatgtc 2700 

tttcgcttaa aagggggtgc accaattaaa ggtgtaacct ttggagaaga tactgtttgg 2760 

gaagttcaag gttacaagaa tgtgagaatc acatttgagc ttgatgaacg tgttgacaaa 2820 

gtgcttaatg aaaagtgctc tgtctacact gttgaatccg gtaccgaagt tactgagttt 2880 

gcatgtgttg tagcagaggc tgttgtgaag actttacaac cagtttctga tctccttacc 2940 

aacatgggta ttgatcttga tgagtggagt gtagctacat tctacttatt tgatgatgct 3000 

ggtgaagaaa acttttcatc acgtatgtat tgttcctttt accctccaga tgaggaagaa 3060 

gaggacgatg cagagtgtga ggaagaagaa attgatgaaa cctgtgaaca tgagtacggt 3120 
acagaggatg attatcaagg tctccctctg gaatttggtg cctcagctga aacagttcga 3180 
gttgaggaag aagaagagga agactggctg gatgatacta ctgagcaatc agagattgag 3240 
ccagaaccag aacctacacc tgaagaacca gttaatcagt ttactggtta tttaaaactt 3300 
actgacaatg ttgccattaa atgtgttgac atcgttaagg aggcacaaag tgctaatcct 3360 
atggtgattg taaatgctgc taacatacac ctgaaacatg gtggtggtgt agcaggtgca 3420 
ctcaacaagg caaccaatgg tgccatgcaa aaggagagtg atgattacat taagctaaat 3480 
ggccctctta cagtaggagg gtcttgtttg ctttctggac ataatcttgc taagaagtgt 3540 
ctgcatgttg ttggacctaa cctaaatgca ggtgaggaca tccagcttct taaggcagca 3600 
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cttgcaccat tgttgtcagc 


aggcatattt 


3660 


ggtgctaaac 


cacttcagtc 


tttacaagtg 


tgcgtgcaga cggttcgtac 


acaggtttat 


3720 


attgcagtca atgacaaagc 


tctttatgag 


caggttgtca tggattatct 


tgataacctg 


3780 


aagcctagag 


tggaagcacc 


taaacaagag 


gagccaccaa acacagaaga 


ttccaaaact 


3840 


gaggagaaat 


ctgtcgtaca 


gaagcctgtc 


gatgtgaagc caaaaattaa 


ggcctgcatt 


3900 


gatgaggtta 


ccacaacact 


ggaagaaact 


aagtttctta ccaataagtt 


actcttgttt 


3960 


gctgatatca 


atggtaagct 


ttaccatgat 


tctcagaaca tgcttagagg 


tgaagatatg 


4020 


tctttccttg 


agaaggatgc 


accttacatg 


gtaggtgatg ttatcactag 


tggtgatatc 


4080 


acttgtgttg 


taataccctc 


caaaaaggct 


ggtggcacta ctgagatgct 


ctcaagagct 


4140 


ttgaagaaag 


tgccagttga 


tgagtatata 


accacgtacc ctggacaagg 


atgtgctggt 


4200 


tatacacttg 


aggaagctaa 


gactgctctt 


aagaaatgca aatctgcatt 


ttatgtacta 


4260 


ccttcagaag 


cacctaatgc 


taaggaagag 


attctaggaa ctgtatcctg 


gaatttgaga 


4320 


gaaatgcttg 


ctcatgctga 


agagacaaga 


aaattaatgc ctatatgcat 


ggatgttaga 


4380 


gccataatgg 


caaccatcca 


acgtaagtat 


aaaggaatta aaattcaaga 


gggcatcgtt 


4440 


gactatggtg 


tccgattctt 


cttttatact 


agtaaagagc ctgtagcttc 


tattattacg 


4500 


aagctgaact 


ctctaaatga 


gccgcttgtc 


acaatgccaa ttggttatgt 


gacacatggt 


4560 


tttaatcttg 


aagaggctgc 


gcgctgtatg 


cgttctctta aagctcctgc 


cgtagtgtca 


4620 


gtatcatcac 


cagatgctgt 


tactacatat 


aatggatacc tcacttcgtc 


atcaaagaca 


4680 


tctgaggagc actttgtaga 


aacagtttct 


ttggctggct cttacagaga 


ttggtcctat 


4740 


tcaggacagc gtacagagtt 


aggtgttgaa 


tttcttaagc gtggtgacaa 


aattgtgtac 


4800 


cacactctgg 


agagccccgt 


cgagtttcat 


cttgacggtg aggttctttc 


acttgacaaa 


4860 


ctaaagagtc tcttatccct 


gcgggaggtt 


aagactataa aagtgttcac 


aactgtggac 


4920 


aacactaatc 


tccacacaca 


gcttgtggat 


atgtctatga catatggaca 


gcagtttggt 


4980 


ccaacatact tggatggtgc 


tgatgttaca aaaattaaac ctcatgtaaa 


tcatgagggt 


5040 


aagactttct ttgtactacc 


tagtgatgac 


acactacgta gtgaagcttt 


cgagtactac 


5100 


catactcttg 


atgagagttt 


tcttggtagg 


tacatgtctg ctttaaacca 


cacaaagaaa 


5160 


tggaaatttc 


ctcaagttgg 


tggtttaact 


tcaattaaat gggctgataa 


caattgttat 


5220 


ttgtctagtg ttttattagc 


acttcaacag 


cttgaagtca aattcaatgc 


accagcactt 


5280 


caagaggctt attatagagc 


ccgtgctggt 


gatgctgcta acttttgtgc 


actcatactc 


5340 


gcttacagta ataaaactgt 


tggcgagctt 


ggtgatgtca gagaaactat 


gacccatctt 


5400 


ctacagcatg 


ctaatttgga 


atctgcaaag 


cgagttctta atgtggtgtg 


taaacattgt 


5460 


ggtcagaaaa 


ctactacctt 


aacgggtgta 


gaagctgtga tgtatatggg 


tactctatct 


5520 


tatgataatc ttaagacagg 


tgtttccatt 


ccatgtgtgt gtggtcgtga 


tgctacacaa 


5580 


tatctagtac aacaagagtc 


ttcttttgtt 


atgatgtctg caccacctgc 


tgagtataaa 


5640 
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gagtacactg gtaactatca 


gtgtggtcat 


5700 


tacactcata 


taactgctaa 


ggagaccctc 


tatcgtattg 


acggagctca 


ccttacaaag 


5760 


atgtcagagt 


acaaaggacc 


agtgactgat 


gttttctaca 


aggaaacatc 


ttacactaca 


5820 


accatcaagc 


ctgtgtcgta 


taaactcgat 


ggagttactt 


acacagagat 


tgaaccaaaa 


5880 


ttggatgggt 


attataaaaa 


ggataatgct 


tactatacag 


agcagcctat 


agaccttgta 


5940 


ccaactcaac 


cattaccaaa 


tgcgagtttt 


gataatttca 


aactcacatg 


ttctaacaca 


6000 


aaatttgctg 


atgatttaaa 


tcaaatgaca 


ggcttcacaa 


agccagcttc 


acgagagcta 


6060 


tctgtcacat 


tcttcccaga 


cttgaatggc 


gatgtagtgg 


ctattgacta 


tagacactat 


6120 


tcagcgagtt 


tcaagaaagg 


tgctaaatta 


ctgcataagc 


caattgtttg 


gcacattaac 


6180 


caggctacaa 


ccaagacaac 


gttcaaacca 


aacacttggt 


gtttacgttg 


tctttggagt 


6240 


acaaagccag 


tagatacttc 


aaattcattt 


gaagttctgg 


cagtagaaga 


cacacaagga 


6300 


atggacaatc 


ttgcttgtga 


aagtcaacaa 


cccacctctg 


aagaagtagt 


ggaaaatcct 


6360 


accatacaga 


aggaagtcat 


agagtgtgac 


gtgaaaacta 


ccgaagttgt 


aggcaatgtc 


6420 


atacttaaac 


catcagatga 


aggtgttaaa 


gtaacacaag 


agttaggtca 


tgaggatctt 


6480 


atggctgctt 


atgtggaaaa 


cacaagcatt 


accattaaga 


aacctaatga 


gctttcacta 


6540 


gccttaggtt 


taaaaacaat 


tgccactcat 


ggtattgctg 


caattaatag 


tgttccttgg 


6600 


agtaaaattt 


tggcttatgt 


caaaccattc 


ttaggacaag 


cagcaattac 


aacatcaaat 


6660 


tgcgctaaga 


gattagcaca 


acgtgtgttt 


aacaattata 


tgccttatgt 


gtttacatta 


6720 


ttgttccaat 


tgtgtacttt 


tactaaaagt 


accaattcta 


gaattagagc 


ttcactacct 


6780 


acaactattg 


ctaaaaatag 


tgttaagagt 


gttgctaaat 


tatgtttgga 


tgccggcatt 


6840 


aattatgtga 


agtcacccaa 


attttctaaa 


ttgttcacaa 


tcgctatgtg 


gctattgttg 


6900 


ttaagtattt 


gcttaggttc 


tctaatctgt 


gtaactgctg 


cttttggtgt 


actcttatct 


6960 


aattttggtg 


ctccttctta 


ttgtaatggc 


gttagagaat 


tgtatcttaa 


ttcgtctaac 


7020 


gttactacta 


tggatttctg 


tgaaggttct 


tttccttgca 


gcatttgttt 


aagtggatta 


7080 


gactcccttg 


attcttatcc 


agctcttgaa 


accattcagg 


tgacgatttc 


atcgtacaag 


7140 


ctagacttga 


caattttagg 


tctggccgct 


gagtgggttt 


tggcatatat 


gttgttcaca 


7200 


aaattctttt 


atttattagg 


tctttcagct 


ataatgcagg 


tgttctttgg 


ctattttgct 


7260 


agtcatttca 


tcagcaattc 


ttggctcatg 


tggtttatca 


ttagtattgt 


acaaatggca 


7320 


cccgtttctg 


caatggttag 


gatgtacatc 


ttctttgctt 


ctttctacta 


catatggaag 


7380 


agctatgttc 


atatcatgga 


tggttgcacc 


tcttcgactt 


gcatgatgtg 


ctataagcgc 


7440 


aatcgtgcca 


cacgcgttga 


gtgtacaact 


attgttaatg 


gcatgaagag 


atctttctat 


7500 


gtctatgcaa 


atggaggccg 


tggcttctgc 


aagactcaca 


attggaattg 


tctcaattgt 


7560 


gacacatttt 


gcactggtag 


tacattcatt 


agtgatgaag 


ttgctcgtga 


tttgtcactc 


7620 


cagtttaaaa 


gaccaatcaa 


ccctactgac 


cagtcatcgt 
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atattgttga 
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gacaaggctg gtcaaaagac 


ctatgagaga 


7740 


catccgctct 


cccattttgt 


caatttagac 


aatttgagag 


ctaacaacac 


taaaggttca 


7800 


ctgcctatta 


atgtcatagt 


ttttgatggc 


aagtccaaat 


gcgacgagtc 


tgcttctaag 


7860 


tctgcttctg 


tgtactacag 


tcagctgatg 


tgccaaccta 


ttctgttgct 


tgaccaagct 


7920 


cttgtatcag 


acgttggaga 


tagtactgaa 


gtttccgtta 


agatgtttga 


tgcttatgtc 


7980 


gacacctttt 


cagcaacttt 


tagtgttcct 


atggaaaaac 


ttaaggcact 


tgttgctaca 


8040 


gctcacagcg 


agttagcaaa 


gggtgtagct 


ttagatggtg 


tcctttctac 


attcgtgtca 


8100 


gctgcccgac 


aaggtgttgt 


tgataccgat 


gttgacacaa 


aggatgttat 


tgaatgtctc 


8160 


aaactttcac 


atcactctga 


cttagaagtg 


acaggtgaca 


gttgtaacaa 


tttcatgctc 


8220 


acctataata 


aggttgaaaa 


catgacgccc 


agagatcttg 


gcgcatgtat 


tgactgtaat 


8280 


gcaaggcata 


tcaatgccca 


agtagcaaaa 


agtcacaatg 


tttcactcat 


ctggaatgta 


8340 


aaagactaca 


tgtctttatc 


tgaacagctg 


cgtaaacaaa 


ttcgtagtgc 


tgccaagaag 


8400 


aacaacatac 


cttttagact 


aacttgtgct 


acaactagac 


aggttgtcaa 


tgtcataact 


8460 


actaaaatct 


cactcaaggg 


tggtaagatt 


gttagtactt 


gttttaaact 


tatgcttaag 


8520 


gccacattat 


tgtgcgttct 


tgctgcattg 


gtttgttata 


tcgttatgcc 


agtacataca 


8580 


ttgtcaatcc 


atgatggtta 


cacaaatgaa 


atcattggtt 


acaaagccat 


tcaggatggt 


8640 


gtcactcgtg 


acatcatttc 


tactgatgat 


tgttttgcaa 


ataaacatgc 


tggttttgac 


8700 


gcatggttta 


gccagcgtgg 


tggttcatac 


aaaaatgaca 


aaagctgccc 


tgtagtagct 


8760 


gctatcatta 


caagagagat 


tggtttcata 


gtgcctggct 


taccgggtac 


tgtgctgaga 


8820 


gcaatcaatg 


gtgacttctt 


gcattttcta 


cctcgtgttt 


ttagtgctgt 


tggcaacatt 


8880 


tgctacacac 


cttccaaact 


cattgagtat 


agtgattttg 


ctacctctgc 


ttgcgttctt 


8940 


gctgctgagt 


gtacaatttt 


taaggatgct 


atgggcaaac 


ctgtgccata 


ttgttatgac 


9000 


actaatttgc 


tagagggttc 


tatttcttat 


agtgagcttc 


gtccagacac 


tcgttatgtg 


9060 


cttatggatg 


gttccatcat 


acagtttcct 


aacacttacc 


tggagggttc 


tgttagagta 


9120 


gtaacaactt 


ttgatgctga 


gtactgtaga 


catggtacat 


gcgaaaggtc 


agaagtaggt 


9180 


atttgcctat 


ctaccagtgg 


tagatgggtt 


cttaataatg 


agcattacag 


agctctatca 


9240 


ggagttttct 


gtggtgttga 


tgcgatgaat 


ctcatagcta 


acatctttac 


tcctcttgtg 


9300 


caacctgtgg 


gtgctttaga 


tgtgtctgct 


tcagtagtgg 


ctggtggtat 


tattgccata 


9360 


ttggtgactt 


gtgctgccta 


ctactttatg 


aaattcagac 


gtgtttttgg 


tgagtacaac 


9420 


catgttgttg 


ctgctaatgc 


acttttgttt 


ttgatgtctt 


tcactatact 


ctgtctggta 


9480 


ccagcttaca 


gctttctgcc 


gggagtctac 


tcagtctttt 


acttgtactt 


gacattctat 


9540 


ttcaccaatg 


atgtttcatt 


cttggctcac 


cttcaatggt 


ttgccatgtt 


ttctcctatt 


9600 


gtgccttttt 


ggataacagc 


aatctatgta 


ttctgtattt 


ctctgaagca 


ctgccattgg 


9660 


ttctttaaca 


actatcttag 


gaaaagagtc 


atgtttaatg 
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gaggaggctg ctttgtgtac ctttttgctc aacaaggaaa tgtacctaaa attgcgtagc 9780 
gagacactgt tgccacttac acagtataac aggtatcttg ctctatataa caagtacaag 9840 
tatttcagtg gagccttaga tactaccagc tatcgtgaag cagcttgctg ccacttagca 9900 
aaggctctaa atgactttag caactcaggt gctgatgttc tctaccaacc accacagaca 9960 

tcaatcactt ctgctgttct gcagagtggt tttaggaaaa tggcattccc gtcaggcaaa 10020 

gttgaagggt gcatggtaca agtaacctgt ggaactacaa ctcttaatgg attgtggttg 10080 

gatgacacag tatactgtcc aagacatgtc atttgcacag cagaagacat gcttaatcct 10140 

aactatgaag atctgctcat tcgcaaatcc aaccatagct ttcttgttca ggctggcaat 10200 

gttcaacttc gtgttattgg ccattctatg caaaattgtc tgcttaggct taaagttgat 10260 

acttctaacc ctaagacacc caagtataaa tttgtccgta tccaacctgg tcaaacattt 10320 

tcagttctag catgctacaa tggttcacca tctggtgttt atcagtgtgc catgagacct 10380 

aatcatacca ttaaaggttc tttccttaat ggatcatgtg gtagtgttgg ttttaacatt 10440 

gattatgatt gcgtgtcttt ctgctatatg catcatatgg agcttccaac aggagtacac 10500 

gctggtactg acttagaagg taaattctat ggtccatttg ttgacagaca aactgcacag 10560 

gctgcaggta cagacacaac cataacatta aatgttttgg catggctgta tgctgctgtt 10620 

atcaatggtg ataggtggtt tcttaataga ttcaccacta ctttgaatga ctttaacctt 10680 

gtggcaatga agtacaacta tgaacctttg acacaagatc atgttgacat attgggacct 10740 

ctttctgctc aaacaggaat tgccgtctta gatatgtgtg ctgctttgaa agagctgctg 10800 

cagaatggta tgaatggtcg tactatcctt ggtagcacta ttttagaaga tgagtttaca 10860 

ccatttgatg ttgttagaca atgctctggt gttaccttcc aaggtaagtt caagaaaatt 10920 

gttaagggca ctcatcattg gatgctttta actttcttga catcactatt gattcttgtt 10980 

caaagtacac agtggtcact gtttttcttt gtttacgaga atgctttctt gccatttact 11040 

cttggtatta tggcaattgc tgcatgtgct atgctgcttg ttaagcataa gcacgcattc 11100 

ttgtgcttgt ttctgttacc ttctcttgca acagttgctt actttaatat ggtctacatg 11160 

cctgctagct gggtgatgcg tatcatgaca tggcttgaat tggctgacac tagcttgtct 11220 

ggttataggc ttaaggattg tgttatgtat gcttcagctt tagttttgct tattctcatg 11280 

acagctcgca ctgtttatga tgatgctgct agacgtgttt ggacactgat gaatgtcatt 11340 

acacttgttt acaaagtcta ctatggtaat gctttagatc aagctatttc catgtgggcc 11400 

ttagttattt ctgtaacctc taactattct ggtgtcgtta cgactatcat gtttttagct 11460 

agagctatag tgtttgtgtg tgttgagtat tacccattgt tatttattac tggcaacacc 11520 

ttacagtgta tcatgcttgt ttattgtttc ttaggctatt gttgctgctg ctactttggc 11580 

cttttctgtt tactcaaccg ttacttcagg cttactcttg gtgtttatga ctacttggtc 11640 

tctacacaag aatttaggta tatgaactcc caggggcttt tgcctcctaa gagtagtatt 11700 

gatgctttca agcttaacat taagttgttg ggtattggag gtaaaccatg tatcaaggtt 11760 
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gtctgacgta 
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aagtgcacat ctgtggtact 


gctctcggtt 


1 "1 D O A 

lloZO 


cttcaacaac 


ttagagtaga 


gtcatcttct 


aaattgtggg 


cacaatgtgt 


acaactccac 


"1 1 O O A 

llooO 


aatgatattc 


ttcttgcaaa 


agacacaact 


gaagctttcg 


agaagatggt 


ttctcttttg 




tctgttttgc 


tatccatgca 


gggtgctgta 


gacattaata 


ggttgtgcga 


ggaaatgctc 


1Z000 


gataaccgtg 


ctactcttca 


ggctattgct 


tcagaattta 


gttctttacc 


atcatatgcc 


lZOoO 


gcttatgcca 


ctgcccagga 


ggcctatgag 


caggctgtag 


ctaatggtga 


ttctgaagtc 


1Z1Z0 


gttctcaaaa 


agttaaagaa 


atctttgaat 


gtggctaaat 


ctgagtttga 


ccgtgatgct 


"1 T1 O A 

lZloO 


gccatgcaac 


gcaagttgga 


aaagatggca 


gatcaggcta 


tgacccaaat 


gtacaaacag 


1ZZ40 


gcaagatctg 


aggacaagag 


ggcaaaagta 


actagtgcta 


tgcaaacaat 


gctcttcact 


IZdOO 


atgcttagga 


agcttgataa 


tgatgcactt 


aacaacatta 


tcaacaatgc 


gcgtgatggt 


±Z3oU 


tgtgttccac 


tcaacatcat 


accattgact 


acagcagcca 


aactcatggt 


tgttgtccct 


"1 O /I OA 
1Z4Z0 


gattatggta 


cctacaagaa 


cacttgtgat 


ggtaacacct 


ttacatatgc 


atctgcactc 


1Z480 


tgggaaatcc 


agcaagttgt 


tgatgcggat 


agcaagattg 


ttcaacttag 


tgaaattaac 


*1 O C/1 A 
1ZZ>4U 


atggacaatt 


caccaaattt 


ggcttggcct 


cttattgtta 


cagctctaag 


agccaactca 


1 O CAA 


gctgttaaac 


tacagaataa 


tgaactgagt 


ccagtagcac 


tacgacagat 


gtcctgtgcg 


IZbOO 


gctggtacca 


cacaaacagc 


ttgtactgat 


gacaatgcac 


ttgcctacta 


taacaattcg 


*1 O 7 OA 

1Z / zu 


aagggaggta 


ggtttgtgct 


ggcattacta 


tcagaccacc 


aagatctcaa 


atgggctaga 


1Z780 


ttccctaaga 


gtgatggtac 


aggtacaatt 


tacacagaac 


tggaaccacc 


ttgtaggttt 


"1 O Q vl A 

!Zo40 


gttacagaca 


caccaaaagg 


gcctaaagtg 


aaatacttgt 


acttcatcaa 


aggcttaaac 


1 "> AAA 

izyou 


aacctaaata 


gaggtatggt 


gctgggcagt 


ttagctgcta 


cagtacgtct 


tcaggctgga 


lzyoo 


aatgctacag 


aagtacctgc 


caattcaact 


gtgctttcct 


tctgtgcttt 


tgcagtagac 


"1 OAOA 

130ZO 


cctgctaaag 


catataagga 


ttacctagca 


agtggaggac 


aaccaatcac 


caactgtgtg 


1 3AQA 


aagatgttgt 


gtacacacac 


tggtacagga 


caggcaatta 


ctgtaacacc 


agaagctaac 


1 31 /I A 

13140 


atggaccaag 


agtcctttgg 


tggtgcttca 


tgttgtctgt 


attgtagatg 


ccacattgac 


1 a OA a 
13ZOO 


catccaaatc 


ctaaaggatt 


ctgtgacttg 


aaaggtaagt 


acgtccaaat 


acctaccact 


"1 3 OCA 
13ZOO 


tgtgctaatg 


acccagtggg 


ttttacactt 


agaaacacag 


tctgtaccgt 


ctgcggaatg 


*1 3 3 OA 
133ZO 


tggaaaggtt 


atggctgtag 


ttgtgaccaa 


ctccgcgaac 


ccttgatgca 


gtctgcggat 


1 O 3 OA 

13380 


gcatcaacgt 


ttttaaacgg 


gtttgcggtg 


taagtgcagc 


ccgtcttaca 


ccgtgcggca 


13/1 / A 

13440 


caggcactag 


tactgatgtc 


gtctacaggg 


cttttgatat 


ttacaacgaa 


aaagttgctg 


IOC AA 

13500 


gttttgcaaa 


gttcctaaaa 


actaattgct 


gtcgcttcca 


ggagaaggat 


gaggaaggca 


1 O CCA 

13DOO 


atttattaga 


ctcttacttt 


gtagttaaga 


ggcatactat 


gtctaactac 


caacatgaag 


13620 


agactattta 


taacttggtt 


aaagattgtc 


cagcggttgc 


tgtccatgac 


tttttcaagt 


1 3 CO A 

13680 


ttagagtaga 


tggtgacatg 


gtaccacata 


tatcacgtca 


gcgtctaact 


aaatacacaa 


13740 


tggctgattt 


agtctatgct 


ctacgtcatt 


ttgatgaggg 
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aaatactcgt cacatacaat tgctgtgatg atgattattt caataagaag gattggtatg 13860 
acttcgtaga gaatcctgac atcttacgcg tatatgctaa cttaggtgag cgtgtacgcc 13920 
aatcattatt aaagactgta caattctgcg atgctatgcg tgatgcaggc attgtaggcg 13980 
tactgacatt agataatcag gatcttaatg ggaactggta cgatttcggt gatttcgtac 14040 
aagtagcacc aggctgcgga gttcctattg tggattcata ttactcattg ctgatgccca 14100 
tcctcacttt gactagggca ttggctgctg agtcccatat ggatgctgat ctcgcaaaac 14160 
cacttattaa gtgggatttg ctgaaatatg attttacgga agagagactt tgtctcttcg 14220 
accgttattt taaatattgg gaccagacat accatcccaa ttgtattaac tgtttggatg 14280 
ataggtgtat ccttcattgt gcaaacttta atgtgttatt ttctactgtg tttccaccta 14340 
caagttttgg accactagta agaaaaatat ttgtagatgg tgttcctttt gttgtttcaa 14400 
ctggatacca ttttcgtgag ttaggagtcg tacataatca ggatgtaaac ttacatagct 14460 
cgcgtctcag tttcaaggaa cttttagtgt atgctgctga tccagctatg catgcagctt 14520 
ctggcaattt attgctagat aaacgcacta catgcttttc agtagctgca ctaacaaaca 14580 
atgttgcttt tcaaactgtc aaacccggta attttaataa agacttttat gactttgctg 14640 
tgtctaaagg tttctttaag gaaggaagtt ctgttgaact aaaacacttc ttctttgctc 14700 
aggatggcaa cgctgctatc agtgattatg actattatcg ttataatctg ccaacaatgt 14760 
gtgatatcag acaactccta ttcgtagttg aagttgttga taaatacttt gattgttacg 14820 
atggtggctg tattaatgcc aaccaagtaa tcgttaacaa tctggataaa tcagctggtt 14880 
tcccatttaa taaatggggt aaggctagac tttattatga ctcaatgagt tatgaggatc 14940 
aagatgcact tttcgcgtat actaagcgta atgtcatccc tactataact caaatgaatc 15000 
ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc tctatctgta 15060 
gtactatgac aaatagacag tttcatcaga aattattgaa gtcaatagcc gccactagag 15120 
gagctactgt ggtaattgga acaagcaagt tttacggtgg ctggcataat atgttaaaaa 15180 
ctgtttacag tgatgtagaa actccacacc ttatgggttg ggattatcca aaatgtgaca 15240 
gagccatgcc taacatgctt aggataatgg cctctcttgt tcttgctcgc aaacataaca 15300 
cttgctgtaa cttatcacac cgtttctaca ggttagctaa cgagtgtgcg caagtattaa 15360 
gtgagatggt catgtgtggc ggctcactat atgttaaacc aggtggaaca tcatccggtg 15420 
atgctacaac tgcttatgct aatagtgtct ttaacatttg tcaagctgtt acagccaatg 15480 
taaatgcact tctttcaact gatggtaata agatagctga caagtatgtc cgcaatctac 15540 
aacacaggct ctatgagtgt ctctatagaa atagggatgt tgatcatgaa ttcgtggatg 15600 
agttttacgc ttacctgcgt aaacatttct ccatgatgat tctttctgat gatgccgttg 15660 
tgtgctataa cagtaactat gcggctcaag gtttagtagc tagcattaag aactttaagg 15720 
cagttcttta ttatcaaaat aatgtgttca tgtctgaggc aaaatgttgg actgagactg 15780 
accttactaa aggacctcac gaattttgct cacagcatac aatgctagtt aaacaaggag 15840 
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atgattacgt gtacctgcct tacccagatc catcaagaat attaggcgca ggctgttttg 15900 

tcgatgatat tgtcaaaaca gatggtacac ttatgattga aaggttcgtg tcactggcta 15960 

ttgatgctta cccacttaca aaacatccta atcaggagta tgctgatgtc tttcacttgt 16020 

atttacaata cattagaaag ttacatgatg agcttactgg ccacatgttg gacatgtatt 16080 

ccgtaatgct aactaatgat aacacctcac ggtactggga acctgagttt tatgaggcta 16140 

tgtacacacc acatacagtc ttgcaggctg taggtgcttg tgtattgtgc aattcacaga 16200 

cttcacttcg ttgcggtgcc tgtattagga gaccattcct atgttgcaag tgctgctatg 16260 

accatgtcat ttcaacatca cacaaattag tgttgtctgt taatccctat gtttgcaatg 16320 

ccccaggttg tgatgtcact gatgtgacac aactgtatct aggaggtatg agctattatt 16380 

gcaagtcaca taagcctccc attagttttc cattatgtgc taatggtcag gtttttggtt 16440 

tatacaaaaa cacatgtgta ggcagtgaca atgtcactga cttcaatgcg atagcaacat 16500 

gtgattggac taatgctggc gattacatac ttgccaacac ttgtactgag agactcaagc 16560 

ttttcgcagc agaaacgctc aaagccactg aggaaacatt taagctgtca tatggtattg 16620 

ccactgtacg cgaagtactc tctgacagag aattgcatct ttcatgggag gttggaaaac 16680 

ctagaccacc attgaacaga aactatgtct ttactggtta ccgtgtaact aaaaatagta 16740 

aagtacagat tggagagtac acctttgaaa aaggtgacta tggtgatgct gttgtgtaca 16800 

gaggtactac gacatacaag ttgaatgttg gtgattactt tgtgttgaca tctcacactg 16860 

taatrgccact tagtgcacct actctagtgc cacaagagca ctatgtgaga attactggct 16920 

tgtacccaac actcaacatc tcagatgagt tttctagcaa tgttgcaaat tatcaaaagg 16980 

tcggcatgca aaagtactct acactccaag gaccacctgg tactggtaag agtcattttg 17040 

ccatcggact tgctctctat tacccatctg ctcgcatagt gtatacggca tgctctcatg 17100 

cagctgttga tgccctatgt gaaaaggcat taaaatattt gcccatagat aaatgtagta 17160 

gaatcatacc tgcgcgtgcg cgcgtagagt gttttgataa attcaaagtg aattcaacac 17220 

tagaacagta tgttttctgc actgtaaatg cattgccaga aacaactgct gacattgtag 17280 

tctttgatga aatctctatg gctactaatt atgacttgag tgttgtcaat gctagacttc 17340 

gtgcaaaaca ctacgtctat attggcgatc ctgctcaatt accagccccc cgcacattgc 17400 

tgactaaagg cacactagaa ccagaatatt ttaattcagt gtgcagactt atgaaaacaa 17460 

taggtccaga catgttcctt ggaacttgtc gccgttgtcc tgctgaaatt gttgacactg 17520 

tgagtgcttt agtttatgac aataagctaa aagcacacaa ggataagtca gctcaatgct 17580 

tcaaaatgtt ctacaaaggt gttattacac atgatgtttc atctgcaatc aacagacctc 17640 

aaataggcgt tgtaagagaa tttcttacac gcaatcctgc ttggagaaaa gctgttttta 17700 

tctcacctta taattcacag aacgctgtag cttcaaaaat cttaggattg cctacgcaga 17760 

ctgttgattc atcacagggt tctgaatatg actatgtcat attcacacaa actactgaaa 17820 

cagcacactc ttgtaatgtc aaccgcttca atgtggctat cacaagggca aaaattggca 17880 
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ttttgtgcat aatgtctgat agagatcttt 
taccacgtcg caatgtggct acattacaag 
gtagtaagat cattactggt cttcatccta 
taaagttcaa gactgaagga ttatgtgttg 
accgtagact catctctatg atgggtttca 
atatgtutat cacccgcgaa gaagctattc 
tagagggctg tcatgcaact agagatgctg 
tttctacagg tgttaactta gtagctgtac 
cagaattcac cagagttaat gcaaaacctc 
cactcatgta taaaggcttg ccctggaatg 
gtgatacact gaaaggattg tcagacagag 
agcttacatc aatgaagtac tttgtcaaga 
acaaacgtgc aacttgcttt tctacttcat 
tgggttttga ctatgtctat aacccattta 
gtaaccttca gagtaaccat gaccaacatt 
gttgtgatgc tatcatgact agatgtttag 
attggtctgt tgaataccct attataggag 
aagtacaaca catggttgtg aagtctgcat 
acattggaaa tccaaaggct atcaagtgtg 
acgatgctca gccatgtagt gacaaagctt 
ctacacatca cgataaattc actgatggtg 
gttacccagc caatgcaatt gtgtgtaggt 
taccaggctg tgatggtggt agtttgtatg 
tcgataaaag tgcatttact aatttaaagc 
cttgtgagtc tcatggcaaa caagtagtgt 
ctacgtgtat tacacgatgc aatttaggtg 
accgacagta cttggatgca tataatatga 
acaaacaatt tgatacttat aacctgtgga 
atgtggctta taatgttgtt aataaaggac 
tttccatcat taataatgct gtttacacaa 
aaaataagac aacacttcct gttaatgttg 
aaccagtgcc agagattaag atactcaata 
taatctggga ctacaaaaga gaagccccag 
tgactgacat tgccaagaaa cctactgaga 



S226CAS111.ST25 
atgacaaact gcaatttaca 


agtctagaaa 


17940 


cagaaaatgt 


aactggactt 


tttaaggact 


18000 


cacaggcacc 


tacacacctc 


agcgttgata 


18060 


acataccagg 


cataccaaag 


gacatgacct 


18120 


aaatgaatta 


ccaagtcaat 


ggttacccta 


18180 


gtcacgttcg 


tgcgtggatt 


ggctttgatg 


18240 


tgggtactaa 


cctacctctc 


cagctaggat 


18300 


cgactggtta 


tgttgacact 


gaaaataaca 


18360 


caccaggtga 


ccagtttaaa 


catcttatac 


18420 


tagtgcgtat 


taagatagta 


caaatgctca 


18480 


tcgtgttcgt 


cctttgggcg 


catggctttg 


18540 


ttggacctga 


aagaacgtgt 


tgtctgtgtg 


18600 


cagatactta 


tgcctgctgg 


aatcattctg 


18660 


tgattgatgt 


tcagcagtgg 


ggctttacgg 


18720 


gccaggtaca 


tggaaatgca 


catgtggcta 


18780 


cagtccatga 


gtgctttgtt 


aagcgcgttg 


18840 


atgaactgag 


ggttaattct 


gcttgcagaa 


18900 


tgcttgctga 


taagtttcca 


gttcttcatg 


18960 


tgcctcaggc 


tgaagtagaa 


tggaagttct 


19020 


acaaaataga 


ggaactcttc 


tattcttatg 


19080 


tttgtttgtt 


ttggaattgt 


aacgttgatc 


19140 


ttgacacaag 


agtcttgtca 


aacttgaact 


19200 


tgaataagca 


tgcattccac 


actccagctt 


19260 


aattgccttt 


cttttactat 


tctgatagtc 


19320 


cggatattga 


ttatgttcca 


ctcaaatctg 


19380 


gtgctgtttg 


cagacaccat 


gcaaatgagt 


19440 


tgatttctgc 


tggatttagc 


ctatggattt 


19500 


atacatttac 


caggttacag 


agtttagaaa 


19560 


actttgatgg 


acacgccggc 


gaagcacctg 


19620 


aggtagatgg 


tattgatgtg 


gagatctttg 


19680 


catttgagct 


ttgggctaag 


cgtaacatta 


19740 


atttgggtgt 


tgatatcgct 


gctaatactg 


19800 


cacatgtatc 


tacaataggt 


gtctgcacaa 


19860 


gtgcttgttc 


ttcacttact 


gtcttgtttg 


19920 
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atggtagagt 


ggaaggacag 


gtagaccttt 
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ttagaaacgc ccgtaatggt 


g LXLLaaiiaa 




cagaaggttc 


agtcaaaggt 


ctaacacctt 


caaagggacc 


agcacaagct 


agcgtcaaug 


ZUU4U 


gagtcacatt 


aattggagaa 


tcagtaaaaa 


cacagtttaa 


ctactttaag 


aaagxagacg 


ZUJ.UU 


gcattattca 


acagttgcct 


gaaacctact 


ttactcagag 


cagagactta 


gaggatttta 


ZU±OU 


agcccagatc 


acaaatggaa 


actgactttc 


tcgagctcgc 


tatggatgaa 


ttcatacagc 




gatataagct 


cgagggctat 


gccttcgaac 


acatcgttta 


tggagatttc 


agxcatiggac 


ZUZoU 


aacttggcgg 


tcttcattta 


atgataggct 


tagccaagcg 


ctcacaagat 


tcaccacttia 


ZU54U 


aattagagga 


ttttatccct 


atggacagca 


cagtgaaaaa 


ttacttcata 


acagatgcgc 


ZU4UU 


aaacaggttc 


atcaaaatgt 


gtgtgttctg 


tgattgatct 


tttacttgat 


gact*tt:g"tcg 


ZU40U 


agataataaa 


gtcacaagat 


ttgtcagtga 


tttcaaaagt 


ggtcaaggtt 


acaattgact 


ZU j/U 


atgctgaaat 


ttcattcatg 


ctttggtgta 


aggatggaca 


tgttgaaacc 


ttctacccaa 




aactacaagc 


aagtcaagcg 


tggcaaccag 


gtgttgcgat 


gcctaacttg 


tacaagatgc 


ZUD4U 


aaagaatgct 


tcttgaaaag 


tgtgaccttc 


agaattatgg 


tgaaaatgct 


gttataccaa 


")n7nn 

zu/uu 


aaggaataat 


gatgaatgtc 


gcaaagtata 


ctcaactgtg 


tcaatactta 


aaracacx ra 


ZU/OU 


ctttagctgt 


accctacaac 


atgagagtta 


ttcactttgg 


tgctggctct 


ga xaaaggag 




ttgcaccagg 


tacagctgtg 


ctcagacaat 


ggttgccaac 


tggcacacta 


ct tgtcgatt 


9HQ Q A 


cagatcttaa 


tgacttcgtc 


tccgacgcag 


attctacttt 


aattggagac 


tgtgcaacag 


zuy4u 


tacatacggc 


taataaatgg 


gaccttatta 


ttagcgatat 


gtatgaccct 


aggaccaaac 


*)i nnn 

zxuuu 


atgtgacaaa 


agagaatgac 


tctaaagaag 


ggtttttcac 


ttatctgtgt 


ggat: Luaraa 


ZXUOU 


agcaaaaact 


agccctgggt 


ggttctatag 


ctgtaaagat 


aacagagcat 


zcx tggaa rg 


oil on 
z±±zu 


ctgaccttta 


caagcttatg 


ggccatttct 


catggtggac 


agcttttgtt 


acaaatgtaa 


91 1 QH 


atgcatcatc 


atcggaagca 


tttttaattg 


gggctaacta 


tcttggcaag 


ccgaaggaac 


91 9 AH 


aaattgatgg 


ctataccatg 


catgctaact 


acattttctg 


gaggaacaca 


aatcctatcc 


91 ann 


agttgtcttc 


ctattcactc 


tttgacatga 


gcaaatttcc 


tcttaaatta 


agaggaactg 


91 acn 


ctgtaatgtc 


tcttaaggag 


aatcaaatca 


atgatatgat 


ttattctctt 


ctggaaaaag 


91 A9H 


gtaggcttat 


cattagagaa 


aacaacagag 


ttgtggtttc 


aagtgatatt 


cttgttaaca 


91 AQH 


actaaacgaa 


catgtttatt 


ttcttattat 


ttcttactct 


cactagtggt 


agtgaccttg 


91 c/in 
Z154U 


accggtgcac 


cacttttgat 


gatgttcaag 


ctcctaatta 


cactcaacat 


acttcatcta 


91 cnn 
Z J.OUU 


tgaggggggt 


ttactatcct 


gatgaaattt 


ttagatcaga 


cactctttat 


txaacxcagg 


91 ccn 


atttatttct 


tccattttat 


tctaatgtta 


cagggtttca 


tactattaat 


catacgtttg 


91 *79A 
Z±/ ZU 


gcaaccctgt 


catacctttt 


aaggatggta 


tttattttgc 


tgccacagag 


aaatcaaatg 


21780 


ttgtccgtgg 


ttgggttttt 


ggttctacca 


tgaacaacaa 


gtcacagtcg 


gtgattatta 


21840 


ttaacaattc 


tactaatgtt 


gttatacgag 


catgtaactt 


tgaattgtgt 


gacaaccctt 


21900 


tctttgctgt 


ttctaaaccc 


atgggtacac 


agacacatac 


tatgatattc 


gataatgcat 


21960 
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tttcgagtac 


atatctgatg 
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ccttttcgct tgatgtttca gaaaagtcag 


22020 


gtaattttaa 


acacttacga 


gagtttgtgt 


ttaaaaataa agatgggttt ctctatgttt 


22080 


ataagggcta 


tcaacctata 


gatgtagttc 


gtgatctacc ttctggtttt aacactttga 


22140 


aacctatttt 


taagttgcct 


cttggtatta 


acattacaaa ttttagagcc 


attcttacag 


22200 


ccttttcacc 


tgctcaagac 


atttggggca 


cgtcagctgc agcctatttt 


gttggctatt 


22260 


taaagccaac 


tacatttatg 


ctcaagtatg 


atgaaaatgg tacaatcaca 


gatgctgttg 


22320 


attgttctca 


aaatccactt 


gctgaactca 


aatgctctgt taagagcttt 


gagattgaca 


22380 


aaggaattta 


ccagacctct 


aatttcaggg 


ttgttccctc aggagatgtt 


gtgagattcc 


22440 


ctaatattac 


aaacttgtgt 


ccttttggag 


aggtttttaa tgctactaaa 


ttcccttctg 


22500 


tctatgcatg 


ggagagaaaa 


aaaatttcta 


attgtgttgc tgattactct 


gtgctctaca 


22560 


actcaacatt 


tttttcaacc 


tttaagtgct 


atggcgtttc tgccactaag 


ttgaatgatc 


22620 


tttgcttctc 


caatgtctat 


gcagattctt 


ttgtagtcaa gggagatgat 


gtaagacaaa 


22680 


tagcgccagg 


acaaactggt 


gttattgctg 


attataatta taaattgcca 


gatgatttca 


22740 


tgggttgtgt 


ccttgcttgg 


aatactagga 


acattgatgc tacttcaact 


ggtaattata 


22800 


attataaata 


taggtatctt 


agacatggca 


agcttaggcc ctttgagaga 


gacatatcta 


22860 


atgtgccttt 


ctcccctgat 


ggcaaacctt 


gcaccccacc tgctcttaat tgttattggc 


22920 


cattaaatga 


ttatggtttt 


tacaccacta 


ctggcattgg ctaccaacct 


tacagagttg 


22980 


tagtactttc 


ttttgaactt 


ttaaatgcac 


cggccacggt ttgtggacca 


aaattatcca 


23040 


ctgaccttat 


taagaaccag 


tgtgtcaatt 


ttaattttaa tggactcact 


ggtactggtg 


-> T 1 r\r\ 

23100 


tgttaactcc 


ttcttcaaag 


agatttcaac 


catttcaaca atttggccgt 


gatgtttctg 


23160 


atttcactga 


ttccgttcga 


gatcctaaaa 


catctgaaat attagacatt 


tcaccttgct 


23220 


cttttggggg 


tgtaagtgta 


attacacctg 


gaacaaatgc ttcatctgaa 


gttgctgttc 


23280 


tatatcaaga 


tgttaactgc 


actgatgttt 


ctacagcaat tcatgcagat 


caactcacac 


23340 


cagcttggcg 


catatattct 


actggaaaca 


atgtattcca gactcaagca 


ggctgtctta 


23400 


taggagctga 


gcatgtcgac 


acttcttatg 


agtgcgacat tcctattgga gctggcattt 


23460 


gtgctagtta 


ccatacagtt 


tctttattac 


gtagtactag ccaaaaatct 


attgtggctt 


23520 


atactatgtc 


tttaggtgct 


gatagttcaa 


ttgcttactc taataacacc 


attgctatac 


23580 


ctactaactt 


ttcaattagc 


attactacag 


aagtaatgcc tgtttctatg 


gctaaaacct 


23640 


ccgtagattg 


taatatgtac 


atctgcggag 


attctactga atgtgctaat ttgcttctcc 


23700 


aatatggtag 


cttttgcaca 


caactaaatc 


gtgcactctc aggtattgct 


gctgaacagg 


23760 


atcgcaacac 


acgtgaagtg 


ttcgctcaag 


tcaaacaaat gtacaaaacc 


ccaactttga 


23820 


aatattttgg 


tggttttaat 


ttttcacaaa 


tattacctga ccctctaaag 


ccaactaaga 


23880 


ggtcttttat 


tgaggacttg 


ctctttaata 


aggtgacact cgctgatgct 


ggcttcatga 


23940 


agcaa-tatgg 


cgaatgccta 


ggtgatatta 


atgctagaga tctcatttgt 


gcgcagaagt 


24000 
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tcaatggact tacagtgttg ccacctctgc tcactgatga tatgattgct gcctacactg 24060 

ctgctctagt tagtggtact gccactgctg gatggacatt tggtgctggc gctgctcttc 24120 

aaataccttt tgctatgcaa atggcatata ggttcaatgg cattggagtt acccaaaatg 24180 

ttctctatga gaaccaaaaa caaatcgcca accaatttaa caaggcgatt agtcaaattc 24240 

aagaatcact tacaacaaca tcaactgcat tgggcaagct gcaagacgtt gttaaccaga 24300 

atgctcaagc attaaacaca cttgttaaac aacttagctc taattttggt gcaatttcaa 24360 

gtgtgctaaa tgatatcctt tcgcgacttg ataaagtcga ggcggaggta caaattgaca 24420 

ggttaattac aggcagactt caaagccttc aaacctatgt aacacaacaa ctaatcaggg 24480 

ctgctgaaat cagggcttct gctaatcttg ctgctactaa aatgtctgag tgtgttcttg 24540 

gacaatcaaa aagagttgac ttttgtggaa agggctacca ccttatgtcc ttcccacaag 24600 

cagccccgca tggtgttgtc ttcctacatg tcacgtatgt gccatcccag gagaggaact 24660 

tcaccacagc gccagcaatt tgtcatgaag gcaaagcata cttccctcgt gaaggtgttt 24720 

ttgtgtttaa tggcacttct tggtttatta cacagaggaa cttcttttct ccacaaataa 24780 

ttactacaga caatacattt gtctcaggaa attgtgatgt cgttattggc atcattaaca 24840 

acacagtztta tgatcctctg caacctgagc ttgactcatt caaagaagag ctggacaagt 24900 

acttcaaaaa tcatacatca ccagatgttg atcttggcga catttcaggc attaacgctt 24960 

ctgtcgtcaa cattcaaaaa gaaattgacc gcctcaatga ggtcgctaaa aatttaaatg 25020 

aatcacucat tgaccttcaa gaattgggaa aatatgagca atatattaaa tggccttggt 25080 

atgtttggct cggcttcatt gctggactaa ttgccatcgt catggttaca atcttgcttt 25140 

gttgcatgac tagttgttgc agttgcctca agggtgcatg ctcttgtggt tcttgctgca 25200 

agtttgatga ggatgactct gagccagttc tcaagggtgt caaattacat tacacataaa 25260 

cgaacttatg gatttgttta tgagattttt tactcttgga tcaattactg cacagccagt 25320 

aaaaattgac aatgcttctc ctgcaagtac tgttcatgct acagcaacga taccgctaca 25380 

agcctcactc cctttcggat ggcttgttat tggcgttgca tttcttgctg tttttcagag 25440 

cgctaccaaa ataattgcgc tcaataaaag atggcagcta gccctttata agggcttcca 25500 

gttcattitgc aatttactgc tgctatttgt taccatctat tcacatcttt tgcttgtcgc 25560 

tgcaggtatg gaggcgcaat ttttgtacct ctatgccttg atatattttc tacaatgcat 25620 

caacgcatgt agaattatta tgagatgttg gctttgttgg aagtgcaaat ccaagaaccc 25680 
attactttat gatgccaact actttgtttg ctggcacaca cataactatg actactgtat 25740 
accatatzaac agtgtcacag atacaattgt cgttactgaa ggtgacggca tttcaacacc 25800 
aaaactcaaa gaagactacc aaattggtgg ttattctgag gataggcact caggtgttaa 25860 
agactatgtc gttgtacatg gctatttcac cgaagtttac taccagcttg agtctacaca 25920 
aattactaca gacactggta ttgaaaatgc tacattcttc atctttaaca agcttgttaa 25980 
agacccaccg aatgtgcaaa tacacacaat cgacggctct tcaggagttg ctaatccagc 26040 
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aatggatcca atttatgatg 


agccgacgac 


gactactagc 


gtgcctttgt 


aagcacaaga 


26100 


aagtgagtac 


gaacttatgt 


actcattcgt 


ttcggaagaa 


acaggtacgt 


taatagttaa 


26160 


tagcgtactt 


ctttttcttg 


ctttcgtggt 


attcttgcta 


gtcacactag 


ccatccttac 


26220 


tgcgcttcga 


ttgtgtgcgt 


actgctgcaa 


tattgttaac 


gtgagtttag 


taaaaccaac 


26280 


ggtttacgtc 


tactcgcgtg 


ttaaaaatct 


gaactcttct 


gaaggagttc 


ctgatcttct 


26340 


ggtctaaacg 


aactaactat 


tattattatt 


ctgtttggaa 


ctttaacatt 


gcttatcatg 


26400 


gcagacaacg 


gtactattac 


cgttgaggag 


cttaaacaac 


tcctggaaca 


atggaaccta 


26460 


gtaataggtt 


tcctattcct 


agcctggatt 


atgttactac 


aatttgccta ttctaatcgg 


26520 


aacaggtittt 


tgtacataat 


aaagcttgtt 


ttcctctggc 


tcttgtggcc 


agtaacactt 


26580 


gcttgttittg 


tgcttgctgc 


tgtctacaga 


attaattggg 


tgactggcgg 


gattgcgatt 


26640 


gcaatggctt 


gtattgtagg 


cttgatgtgg 


cttagctact 


tcgttgcttc 


cttcaggctg 


26700 


tttgctcgta 


cccgctcaat 


gtggtcattc 


aacccagaaa 


caaacattct 


tctcaatgtg 


26760 


cctctccggg 


ggacaattgt 


gaccagaccg 


ctcatggaaa 


gtgaacttgt 


cattggtgct 


26820 


gtgatcattc gtggtcactt 


gcgaatggcc 


ggacactccc 


tagggcgctg 


tgacattaag 


26880 


gacctgccaa aagagatcac 


tgtggctaca tcacgaacgc 


tttcttatta 


caaattagga 


26940 


gcgtcgcagc gtgtaggcac 


tgattcaggt 


tttgctgcat 


acaaccgcta 


ccgtattgga 


27000 


aactataaat 


taaatacaga 


ccacgccggt 


agcaacgaca 


atattgcttt 


gctagtacag 


27060 


taagtgacaa cagatgtttc 


atcttgttga 


cttccaggtt 


acaatagcag 


agatattgat 


27120 


tatcattatg 


aggactttca 


ggattgctat ttggaatctt gacgttataa taagttcaat 


27180 


agtgagacaa 


ttatttaagc 


ctctaactaa gaagaattat 


tcggagttag 


atgatgaaga 


27240 


acctatggag ttagattatc 


cataaaacga acatgaaaat 


tattctcttc 


ctgacattga 


27300 


ttgtatttac atcttgcgag 


ctatatcact 


atcaggagtg 


tgttagaggt 


acgactgtac 


27360 


tactaaaaga accttgccca 


tcaggaacat 


acgagggcaa 


ttcaccattt 


caccctcttg 


27420 


ctgacaataa atttgcacta 


acttgcacta 


gcacacactt 


tgcttttgct 


tgtgctgacg 


27480 


gtactcgaca tacctatcag 


ctgcgtgcaa gatcagtttc 


accaaaactt 


ttcatcagac 


27540 


aagaggaggt tcaacaagag 


ctctactcgc 


cactttttct 


cattgttgct 


gctctagtat 


27600 


ttttaatact ttgcttcacc 


attaagagaa agacagaatg aatgagctca ctttaattga 


27660 


cttctatttg 


tgctttttag 


cctttctgct 


attccttgtt 


ttaataatgc 


ttattatatt 


27720 


ttggttttca 


ctcgaaatcc 


aggatctaga 


agaaccttgt 


accaaagtct 


aaacgaacat 


27780 


gaaacttctc 


attgttttga 


cttgtatttc 


tctatgcagt 


tgcatatgca 


ctgtagtaca 


27840 


gcgctgtgca 


tctaataaac 


ctcatgtgct tgaagatcct 


tgtaaggtac 


aacactaggg 


27900 


gtaatactta tagcactgct 


tggctttgtg ctctaggaaa ggttttacct tttcatagat 


27960 


ggcacactat 


ggttcaaaca 


tgcacaccta 


atgttactat 


caactgtcaa gatccagctg 


28020 


gtggtgcgct tatagctagg 


tgttggtacc 


ttcatgaagg 


tcaccaaact 


gctgcattta 


28080 
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gagacgtact 


tgttgttrtta 


aataaacgaa caaattaaaa tgtctgataa tggaccccaa 


28140 


tcaaaccaac 


gtagtgcccc 


ccgcattaca 


tttggtggac 


ccacagattc 


aactgacaat 


28200 


aaccagaatg 


gaggacgcaa 


tggggcaagg 


ccaaaacagc 


gccgacccca 


aggtttaccc 


28260 


aataatactg 


cgtcttggtt 


cacagctctc 


actcagcatg 


gcaaggagga 


acttagattc 


28320 


cctcgaggcc 


agggcgttcc 


aatcaacacc 


aatagtggtc 


cagatgacca 


aattggctac 


28380 


taccgaagag 


ctacccgacg 


agttcgtggt 


ggtgacggca 


aaatgaaaga 


gctcagcccc 


28440 


agatggtact 


tctattacct 


aggaactggc 


ccagaagctt 


cacttcccta 


cggcgctaac 


28500 


aaagaaggca 


tcgtatgggt 


tgcaactgag 


ggagccttga 


atacacccaa 


agaccacatt 


28560 


ggcacccgca 


atcctaataa 


caatgctgcc 


accgtgctac 


aacttcctca 


aggaacaaca 


28620 


ttgccaaaag 


gcttctacgc 


agagggaagc 


agaggcggca 


gtcaagcctc 


ttctcgctcc 


28680 


tcatcacgta 


gtcgcggtaa 


ttcaagaaat 


tcaactcctg 


gcagcagtag 


gggaaattct 


28740 


cctgctcgaa 


tggctagcgg 


aggtggtgaa 


actgccctcg 


cgctattgct 


gctagacaga 


28800 


ttgaaccagc 


ttgagagcaa 


agtttctggt 


aaaggccaac 


aacaacaagg 


ccaaactgtc 


28860 


actaagaaat 


ctgctgctga 


ggcatctaaa 


aagcctcgcc 


aaaaacgtac 


tgccacaaaa 


28920 


cagtacaacg 


tcactcaagc 


atttgggaga 


cgtggtccag 


aacaaaccca 


aggaaatttc 


28980 


ggggaccaag 


acctaatcag 


acaaggaact 


gattacaaac 


attggccgca 


aattgcacaa 


29040 


tttgctccaa 


gtgcctctgc 


attctttgga atgtcacgca ttggcatgga agtcacacct 


29100 


tcgggaacat 


ggctgactta 


tcatggagcc 


attaaattgg 


atgacaaaga 


tccacaattc 


29160 


aaagacaacg 


tcatactgct 


gaacaagcac 


attgacgcat 


acaaaacatt 


cccaccaaca 


29220 


gagcctaaaa 


aggacaaaaa 


gaaaaagact 


gatgaagctc 


agcctttgcc 


gcagagacaa 


29280 


aagaagcagc 


ccactgtgac 


tcttcttcct 


gcggctgaca 


tggatgattt 


ctccagacaa 


29340 


cttcaaaatt 


ccatgagtgg 


agcttctgct 


gattcaactc 


aggcataaac 


actcatgatg 


29400 


accacacaag 


gcagatgggc 


tatgtaaacg 


ttttcgcaat 


tccgtttacg 


atacatagtc 


29460 


tactcttgtg 


cagaatgaat 


tctcgtaact 


aaacagcaca 


agtaggttta 


gttaacttta 


29520 


atctcacata 


gcaatcttta 


atcaatgtgt 


aacattaggg 


aggacttgaa 


agagccacca 


29580 


cattttcatc 


gaggccacgc 


ggagtacgat 


cgagggtaca 


gtgaataatg 


ctagggagag 


29640 


ctgcctatat 


ggaagagccc 


taatgtgtaa 


aattaatttt 


agtagtgcta 


tccccatgtg 


29700 


attttaatag 


cttcttagga 


gaatgacaaa 


aaaaaaaaaa 


aaaaaa 




29746 



<210> 2 

<211> 3945 

<212> DNA 

<213> CORONAVIRUS 



<220> 
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ttc ttt get gtt tct aaa ccc atg ggt aca cag aca cat act atg ata 
Phe Phe Ala Val Ser Lys Pro Met Gly Thr Gin Thr His Thr Met lie 
140 145 150 



teg ctt gat gtt tea gaa aag tea ggt aat ttt aaa cac tta cga gag 
ser Leu Asp val ser Glu Lys Ser Gly Asn Phe Lys His Leu Arg Glu 
170 175 180 



caa cct ata gat gta gtt cgt gat eta cct tct ggt ttt aac act ttg 
Gin Pro He Asp Val val Arg Asp Leu Pro ser Gly Phe Asn Thr Leu 
205 210 215 
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208 



<221> CDS 

<222> (89). -C3853) 

<223> 



<400> 2 

ttctcttctg gaaaaaggta ggcttatcat tagagaaaac aacagagttg tggtttcaag 60 

tgatattctt gttaacaact aaacgaac atg ttt att ttc tta tta ttt ctt 112 

Met Phe lie Phe Leu Leu Phe Leu 
1 5 

act etc act agt ggt agt gac ctt gac egg tgc acc act ttt gat gat 160 
Thr Leu Thr Ser Gly ser Asp Leu Asp Arg cys Thr Thr Phe Asp Asp 
10 15 20 

gtt caa get cct aat tac act caa cat act tea tct atg agg ggg gtt 
val Gin Ala Pro Asn Tyr Thr Gin His Thr ser ser Met Arg Gly Val 
25 30 35 40 

tac tat cct gat gaa att ttt aga tea gac act ctt tat tta act cag 256 
Tyr Tyr Pro Asp Glu lie Phe Arg Ser Asp Thr Leu Tyr Leu Thr Gin 
45 50 55 

gat tta ttt ctt cca ttt tat tct aat gtt aca ggg ttt cat act att 304 
Asp Leu Phe Leu Pro Phe Tyr Ser Asn Val Thr Gly Phe His Thr lie 
60 65 70 

aat cat acg ttt ggc aac cct gtc ata cct ttt aag gat ggt att tat 
Asn His Thr Phe Gly Asn Pro Val lie Pro Phe Lys Asp Gly lie Tyr 
75 80 85 

ttt get gee aca gag aaa tea aat gtt gtc cgt ggt tgg gtt ttt ggt 
Phe Ala Ala Thr Glu Lys ser Asn Val val Arg Gly Trp val Phe Gly 
90 95 100 

tct acc atg aac aac aag tea cag teg gtg att att att aac aat tct 448 
ser Thr Met Asn Asn Lys Ser Gin ser val lie lie lie Asn Asn Ser 
105 110 115 120 

act aat gtt gtt ata cga gca tgt aac ttt gaa ttg tgt gac aac cct 496 
Thr Asn val Val lie Arg Ala cys Asn Phe Glu Leu cys Asp Asn Pro 
125 130 135 



352 



400 



544 



ttc gat aat gca ttt aat tgc act ttc gag tac ata tct gat gec ttt 592 
Phe Asp Asn Ala Phe Asn Cys Thr Phe Glu Tyr lie Ser Asp Ala Phe 
155 160 165 



640 



ttt gtg ttt aaa aat aaa gat ggg ttt etc tat gtt tat aag ggc tat 688 
Phe val Phe Lys Asn Lys Asp Gly Phe Leu Tyr val Tyr Lys Gly Tyr 
185 190 195 200 



736 
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aaa cct att ttt aag ttg cct ctt ggt att aac att aca aat ttt aga 
Lys Pro lie phe Lys Leu Pro Leu Gly lie Asn lie Thr Asn Phe Arg 
220 225 230 



get gca gec tat ttt gtt ggc tat tta aag cca act aca ttt atg etc 
Ala Ala Ala Tyr Phe Val Gly Tyr Leu Lys Pro Thr Thr Phe Met Leu 
250 255 260 

aag tat gat gaa aat ggt aca ate aca gat get gtt gat tgt tct caa 
Lys Tyr Asp Glu Asn Gly Thr rle Thr Asp Ala Val Asp cys ser Gin 
265 270 275 280 



aaa gga att tac cag ace tct aat ttc agg gtt gtt ccc tea gga gat 

Lys Gly lie Tyr Gin Thr Ser Asn Phe Arg Val val Pro ser Gly Asp 

300 305 ~ 310 

gtt gtg aga ttc cct aat att aca aac ttg tgt cct ttt gga gag gtt 

val val Arg Phe Pro Asn lie "Thr Asn Leu Cys Pro Phe Gly Glu Val 

315 320 325 



gat gta aga caa ata gcg cca gga caa act ggt gtt att get gat tat 
Asp val Arg Gin lie Ala Pro Gly Gin Thr Gly val lie Ala Asp Tyr 
395 400 405 



aat gtg cct ttc tec cct gat ggc aaa cct tgc ace cca cct get ctt 
Asn val Pro Phe ser Pro Asp Gly Lys Pro Cys Thr Pro pro Ala Leu 
460 465 470 

aat tgt tat tgg cca tta aat gat tat ggt ttt tac acc act act ggc 
Asn cys Tyr Trp Pro Leu Asn Asp Tyr Gly Phe Tyr Thr Thr Thr Gly 
475 480 485 
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784 



gee att ctt aca gee ttt tea cct get caa gac att tgg ggc acg tea 832 
Ala lie Leu Thr Ala Phe ser Pro Ala Gin Asp lie Trp Gly Thr Ser 
235 240 245 



880 



928 



aat cca ctt get gaa etc aaa tgc tct gtt aag age ttt gag att gac 976 
Asn Pro Leu Ala Glu Leu Lys Cys ser val Lys Ser Phe Glu lie Asp 
285 290 295 



1024 



1072 



ttt aat get act aaa ttc cct tct gtc tat gca tgg gag aga aaa aaa 1120 

Phe Asn Ala Thr Lys Phe Pro Ser Val Tyr Ala Trp Glu Arg Lys Lys 

330 335 340 

att tct aat tgt gtt get gat tac tct gtg etc tac aac tea aca ttt 1168 

lie ser Asn cys Val Ala Asp "Tyr ser Val Leu Tyr Asn ser Thr Phe 

345 350 355 360 

ttt tea acc ttt aag tgc tat ggc gtt tct gee act aag ttg aat gat 1216 

Phe ser Thr Phe Lys cys Tyr Gly val ser Ala Thr Lys Leu Asn Asp 

365 370 375 

ctt tgc ttc tec aat gtc tat gca gat tct ttt gta gtc aag gga gat 1264 

Leu cys Phe ser Asn Val Tyr Ala Asp ser Phe val val Lys Gly Asp 

380 385 390 



1312 



aat tat aaa ttg cca gat gat ttc atg ggt tgt gtc ctt get tgg aat 1360 

Asn Tyr Lys Leu Pro Asp Asp Phe Met Gly Cys Val Leu Ala Trp Asn 
410 415 420 

act agg aac att gat get act tea act ggt aat tat aat tat aaa tat 1408 

Thr Arg Asn lie Asp Ala Thr ser Thr Gly Asn Tyr Asn Tyr Lys Tyr 
425 430 435 440 

agg tat ctt aga cat ggc aag ctt agg ccc ttt gag aga gac ata tct 1456 

Arg Tyr Leu Arg His Gly Lys Leu Arg Pro Phe Glu Arg Asp lie ser 

445 450 455 



1504 



1552 
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att ggc tac caa cct tac aga gtt gta gta ctt tct ttt gaa ctt tta 

lie Gly Tyr Gin Pro Tyr Arg val Val Val Leu ser Phe Glu Leu Leu 

490 495 500 

aat gca ccg gcc acg gtt tzgt gga cca aaa tta tec act gac ctt att 

Asn Ala Pro Ala Thr Val cys Gly Pro Lys Leu ser Thr Asp Leu lie 

505 510 515 520 

aag aac cag tgt gtc aat ttt aat ttt aat gqa etc act ggt act ggt 

Lys Asn Gin Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly 

525 530 535 

gtg tta act cct tct tea aag aga ttt caa cca ttt caa caa ttt ggc 

val Leu Thr Pro Ser Ser Lys Arg Phe Gin Pro Phe Gin Gin Phe Gly 

540 " 545 550 



gaa ata tta gac att tea cct tgc tct ttt ggg ggt gta agt gta att 
Glu lie Leu Asp lie ser Pro cys ser Phe Gly Gly val ser val lie 
570 575 580 

aca cct gga aca aat get tea tct gaa gtt get gtt eta tat caa gat 
Thr Pro Gly Thr Asn Ala Ser Ser Glu Val Ala Val Leu Tyr Gin Asp 
585 590 595 600 



tta ggt get gat agt tea att get tac tct aat aac ace att get ata 
Leu Gly Ala Asp Ser Ser lie Ala Tyr Ser Asn Asn Thr lie Ala lie 
685 690 695 



act gaa tgt get aat ttg ctt etc caa tat ggt age ttt tgc aca caa 

Thr Glu cys Ala Asn Leu Leu Leu Gin Tyr Gly ser Phe cys Thr Gin 
730 735 740 

eta aat cgt gca etc tea ggt att get get gaa cag gat cgc aac aca 

Leu Asn Arg Ala Leu Ser Gly lie Ala Ala Glu Gin Asp Arg Asn Thr 

745 750 755 760 



1600 



1648 



1696 



1744 



cgt gat gtt tct gat ttc act gat tec gtt cga gat cct aaa aca tct 1792 
Arg Asp val ser Asp Phe Thr Asp ser Val Arg Asp Pro Lys Thr Ser 
555 560 565 



1840 



1888 



gtt aac tgc act gat gtt tct aca gca att cat gca gat caa etc aca 1936 

val Asn cys Thr Asp Val Ser Thr Ala lie His Ala Asp Gin Leu Thr 
605 610 615 

cca get tgg cgc ata tat tct act gqa aac aat gta ttc cag act caa 1984 

pro Ala Trp Arg lie Tyr Ser Thr Gly Asn Asn Val Phe Gin Thr Gin 
620 625 630 

gca ggc tgt ctt ata gqa get gag cat gtc gac act tct tat gag tgc 

Ala Gly cys Leu lie Gly Ala Glu His val Asp Thr Ser Tyr Glu cys 
635 640 645 

gac att cct att gqa get ggc att tgt get agt tac cat aca gtt tct 

Asp lie Pro lie Gly Ala Gly lie Cys Ala Ser Tyr His Thr val Ser 
650 655 660 

tta tta cgt agt act age caa aaa tct att gtg get tat act atg tct 2128 

Leu Leu Arg Ser Thr ser Gin Lys ser lie Val Ala Tyr Thr Met Ser 

665 " 670 675 680 



2032 



2080 



2176 



cct act aac ttt tea att age att act aca gaa gta atg cct gtt tct 2224 
Pro Thr Asn Phe ser lie Ser lie Thr Thr Glu val Met Pro val ser 
700 705 710 

atg get aaa acc tec gta gat tgt aat atg tac ate tgc gga gat tct 2272 
Met Ala Lys Thr Ser val Asp cys Asn Met Tyr lie cys Gly Asp ser 
715 720 725 



2320 
2368 
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cgt gaa gtg 
Arg Glu val 



aaa tat ttt 
Lys Tyr Phe 



aag cca act 
Lys Pro Thr 
795 

aca etc get 
Thr Leu Ala 
810 

gat att aat 
Asp lie Asn 
825 



S226CAS111.ST25 

ttc get caa gtc aaa caa atg tac aaa acc cca act ttg 

Phe Ala Gin val Lys Gin Met Tyr Lys Thr Pro Thr Leu 
765 770 775 

ggt ggt ttt aat ttt tea caa ata tta cct gac cct eta 

Gly Gly Phe Asn Phe Ser Gin He Leu Pro Asp Pro Leu 

780 785 790 



aag agg tct 
Lys Arg ser 



ttt att gag gac ttg etc ttt aat aag gtg 

Phe lie Glu Asp Leu Leu Phe Asn Lys val 
800 805 

gat get ggc ttc atg aag caa tat ggc gaa tgc eta ggt 

Asp Ala Gly Phe Met Lys Gin Tyr Gly Glu Cys Leu Gly 



815 



820 



get aga gat etc att tgt gcg cag aag ttc aat gga ctt 
Ala Arg Asp Leu He Cys Ala Gin Lys Phe Asn Gly Leu 
830 835 840 



cca cct ctg etc act gat gat atg att get gee tac act 
Thr vaT Leu Pro Pro Leu Leu Thr Asp Asp Met lie Ala Ala Tyr Thr 
845 850 855 



aca gtg ttg 



get get eta 
Ala Ala Leu 



ggc get get 
Gly Ala Ala 
875 

aat ggc att 
Asn Gly lie 
890 

ate gee aac 
lie Ala Asn 
905 



aca aca aca 
Thr Thr Thr 



aat get caa 
Asn Ala Gin 



ggt gca att 
Gly Ala lie 
955 

gtc gag gcg 
val Glu Ala 
970 

age ctt caa 
ser Leu Gin 
985 

agg get tct 
Arg Ala ser 



gtt agt ggt act gee act get gga tgg aca ttt ggt get 
val ser Gly Thr Ala Thr Ala Gly Trp Thr Phe Gly Ala 
860 865 870 

ctt caa ata cct ttt get atg caa atg gca tat agg ttc 
Leu Gin lie Pro Phe Ala Met Gin Met Ala Tyr Arg Phe 
880 885 

gga gtt acc caa aat gtt etc tat gag aac caa aaa caa 
Gly val Thr Gin Asn Val Leu Tyr Glu Asn Gin Lys Gin 
895 900 

caa ttt aac aag gcg att agt caa att caa gaa tea ctt 
Gin Phe Asn Lys Ala lie ser Gin He Gin Glu Ser Leu 
910 915 920 

tea act gca ttg ggc aag ctg caa gac gtt gtt aac cag 
Ser Thr Ala Leu Gly Lys Leu Gin Asp Val Val Asn Gin 
925 930 935 

gca tta aac aca ctt gtt aaa caa ctt age tct aat ttt 
Ala Leu Asn Thr Leu val Lys Gin Leu ser ser Asn Phe 
940 945 950 

tea agt gtg eta aat gat ate ctt teg cga ctt gat aaa 
ser ser Val Leu Asn Asp lie Leu Ser Arg Leu Asp Lys 
960 965 

gag gta caa att gac agg tta att aca ggc aga ctt caa 
Glu Val Gin He Asp Arg Leu lie Thr Gly Arg Leu Gin 
975 980 

acc tat gta aca caa caa eta ate agg get get gaa ate 
Thr Tyr Val Thr Gin Gin Leu lie Arg Ala Ala Glu lie 
990 995 1000 

get aat ctt get get act aaa atg tct gag tgt gtt 
Ala Asn Leu Ala Ala Thr Lys Met Ser Glu cys val 
1005 1010 1015 



ctt gga caa tea aaa aga gtt gac ttt tgt gga aag ggc tac cac 
Leu Gly Gin ser Lys_ Arg Val Asp Phe Cys_ Gly Lys Gly Tyr His 



2416 

2464 

2512 

2560 

2608 

2656 

2704 

2752 

2800 

2848 

2896 

2944 

2992 

3040 

3088 

3133 

3178 



1020 



1025 
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ctt atg tec ttc cca caa gca gcc ccg cat ggt gtt gtc ttc eta 3223 

Leu Met Ser Phe Pro Gin Ala Ala Pro His Gly Val Val Phe Leu 
1035 1040 1045 

cat gtc acg tat gtg cca tec cag gag agg aac ttc ace aca gcg 3268 

His Val Thr Tyr Val Pro Ser Gin Glu Arg Asn Phe Thr Thr Ala 
1050 1055 1060 

cca gca att tgt cat gaa ggc aaa gca tac ttc cct cgt gaa ggt 3313 

pro Ala lie Cys His Glu Gly Lys Ala Tyr Phe Pro Arg Glu Gly 
1065 1070 1075 

gtt ttt gtg ttt aat ggc act tct tgg ttt att aca cag agg aac 3358 

val Phe val Phe Asn Gly Thr Ser Trp Phe lie Thr Gin Arg Asn 
1080 1085 1090 

ttc ttt tct cca caa ata att act aca gac aat aca ttt gtc tea 3403 

Phe Phe ser Pro Gin He lie Thr Thr Asp Asn Thr Phe val ser 
1095 1100 1105 

gga aat tgt gat gtc gtt att ggc ate att aac aac aca gtt tat 3448 

Gly Asn cys Asp Val val lie Gly lie He Asn Asn Thr val Tyr 
1110 1115 1120 

gat cct ctg caa cct gag ctt gac tea ttc aaa gaa gag ctg gac 3493 

Asp Pro Leu Gin Pro Glu Leu Asp ser Phe Lys Glu Glu Leu Asp 
1125 1130 1135 

aag tac ttc aaa aat cat aca tea cca gat gtt gat ctt ggc gac 3538 
Lys Tyr Phe Lys Asn His Thr ser Pro Asp Val Asp Leu Gly Asp 
1140 1145 1150 



att tea ggc att aac get tct gtc gtc aac att caa aaa gaa att 
He Ser Gly lie Asn Ala Ser val Val Asn He Gin Lys Glu lie 
1155 1160 1165 



etc aag ggt gca tgc tct tgt ggt tct tgc tgc aag ttt gat gag 
Leu Lys Gly Ala cys Ser cys Gly Ser cys cys Lys Phe Asp Glu 
1230 1235 1240 



<210> 3 
<211> 1255 



3583 



gac cgc etc aat gag gtc get aaa aat tta aat gaa tea etc att 3628 
Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu ser Leu lie 
K 1170 1175 1180 

gac ctt caa gaa ttg gga aaa tat gag caa tat att aaa tgg cct 3673 
Asp Leu Gin Glu Leu Gly Lys Tyr Glu Gin Tyr He Lys Trp Pro 
1185 1190 1195 

tgg tat gtt tgg etc ggc ttc att get gga eta att gcc ate gtc 3718 
Trp Tyr val Trp Leu Gly Phe lie Ala Gly Leu lie Ala lie val 
1200 1205 1210 

atg gtt aca ate ttg ctt tgt tgc atg act agt tgt tgc agt tgc 3763 
Met val Thr lie Leu Leu Cys Cys Met Thr ser cys cys Ser Cys 
1215 1220 1225 

tct tgt ggt tct tgc tgc aag ttt gat gag 3808 

cys Lys Phe Asp Glu 
1240 

gat gac tct gag cca gtt etc aag ggt gtc aaa tta cat tac aca 3853 
Asp Asp ser Glu Pro val Leu Lys Gly Val Lys Leu His Tyr Thr 
1245 1250 1255 

taaacgaact tatggatttg tttatgagat tttttactct tggatcaatt actgcacagc 3913 

cagtaaaaat tgacaatget tctcctgcaa gt 3945 
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<212> PRT 

<213> CORONAVIRUS 

<400> 3 

Met Phe He Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly Ser Asp Leu 
15 10 15 

Asp Arg Cys Thr Thr Phe Asp Asp val Gin Ala Pro Asn Tyr Thr Gin 
20 25 30 

His Thr ser ser Met Arg Gly val Tyr Tyr Pro Asp Glu lie Phe Arg 
35 40 45 

ser Asp Thr Leu Tyr Leu Thr Gin Asp Leu Phe Leu Pro Phe Tyr ser 
50 55 60 

Asn val Thr Gly Phe His Thr lie Asn His Thr Phe Gly Asn Pro val 
65 70 75 80 

lie Pro Phe Lys Asp Gly lie Tyr Phe Ala Ala Thr Glu Lys Ser Asn 
85 90 95 

Val val Arg Gly Trp Val Phe Gly Ser Thr Met Asn Asn Lys Ser Gin 
100 105 110 

Ser val lie lie lie Asn Asn ser Thr Asn val val lie Arg Ala Cys 
115 120 125 

Asn Phe Glu Leu Cys Asp Asn Pro Phe Phe Ala val Ser Lys Pro Met 
130 135 140 

Gly Thr Gin Thr His Thr Met lie Phe Asp Asn Ala Phe Asn Cys Thr 
145 150 155 160 

Phe Glu Tyr lie Ser Asp Ala Phe ser Leu Asp val Ser Glu Lys Ser 
165 170 175 

Gly Asn Phe Lys His Leu Arg Glu Phe val Phe Lys Asn Lys Asp Gly 
180 18 5 190 

Phe Leu Tyr val Tyr Lys Gly Tyr Gin pro lie Asp val val Arg Asp 
195 200 205 

Leu Pro Ser Gly Phe Asn Thr Leu Lys pro lie Phe Lys Leu Pro Leu 
210 215 220 

Gly lie Asn lie Thr Asn Phe Arg Ala lie Leu Thr Ala Phe ser Pro 
225 230 235 240 
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Ala Gin Asp lie Trp Gly Thr ser Ala Ala Ala Tyr phe val Gly Tyr 
245 250 255 

Leu Lys Pro Thr Thr phe Met Leu Lys Tyr Asp Glu Asn Gly Thr lie 
260 265 270 

Thr Asp Ala val Asp Cys ser Gin Asn Pro Leu Ala Glu Leu Lys cys 
275 280 285 

ser Val Lys Ser Phe Glu lie Asp Lys Gly He Tyr Gin Thr ser Asn 
290 295 300 

Phe Arg val Val Pro ser Gly Asp Val val Arg Phe Pro Asn lie Thr 
305 310 315 320 

Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser 
325 330 335 

val Tyr Ala Trp Glu Arg Lys Lys lie Ser Asn cys val Ala Asp Tyr 
340 345 350 

ser val Leu Tyr Asn Ser Thr Phe Phe Ser Thr Phe Lys cys Tyr Gly 
355 360 365 

val Ser Ala Thr Lys Leu Asn Asp Leu Cys Phe ser Asn val Tyr Ala 
370 375 380 

Asp ser Phe val val Lys Gly Asp Asp val Arg Gin lie Ala Pro Gly 
385 390 395 400 

Gin Thr Gly val lie Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe 
405 410 415 

Met Gly cys Val Leu Ala Trp Asn Thr Arg Asn He Asp Ala Thr Ser 
420 425 430 

Thr Gly Asn Tyr Asn Tyr Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu 
435 440 445 

Arg pro Phe Glu Arg Asp lie Ser Asn val Pro Phe ser Pro Asp Gly 
450 455 460 

Lys Pro cys Thr Pro Pro Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp 
465 470 475 480 

Tyr Gly Phe Tyr Thr Thr Thr Gly lie Gly Tyr Gin Pro Tyr Arg val 
485 490 495 

Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr val cys Gly 
500 505 510 
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Pro Lys Leu ser Thr Asp Leu lie Lys Asn Gin cys Val Asn Phe Asn 
515 520 525 

Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Pro ser ser Lys Arg 
530 535 540 

Phe Gin Pro Phe Gin Gin Phe Gly Arg Asp Val Ser Asp Phe Thr Asp 
545 550 555 560 

ser val Arg Asp Pro Lys Thr ser Glu He Leu Asp lie ser Pro Cys 
565 570 575 

Ser Phe Gly Gly Val Ser Val He Thr Pro Gly Thr Asn Ala Ser ser 
580 585 590 

Glu val Ala val Leu Tyr Gin Asp Val Asn Cys Thr Asp val Ser Thr 
595 600 605 

Ala lie His Ala Asp Gin Leu Thr Pro Ala Trp Arg lie Tyr ser Thr 
610 615 620 

Gly Asn Asn Val Phe Gin Thr Gin Ala Gly Cys Leu lie Gly Ala Glu 
625 630 635 640 

His val Asp Thr ser Tyr Glu cys Asp lie Pro lie Gly Ala Gly lie 
645 650 655 

Cys Ala ser Tyr His Thr Val Ser Leu Leu Arg ser Thr Ser Gin Lys 
660 665 670 

Ser lie Val Ala Tyr Thr Met Ser Leu Gly Ala Asp Ser Ser lie Ala 
675 680 685 

Tyr Ser Asn Asn Thr lie Ala lie Pro Thr Asn Phe Ser lie Ser lie 
690 695 700 

Thr Thr Glu Val Met Pro Val Ser Met Ala Lys Thr ser Val Asp Cys 
705 710 715 720 

Asn Met Tyr lie cys Gly Asp Ser Thr Glu cys Ala Asn Leu Leu Leu 
725 730 735 

Gin Tyr Gly ser Phe cys Thr Gin Leu Asn Arg Ala Leu Ser Gly lie 
740 745 ~ 750 

Ala Ala Glu Gin Asp Arg Asn Thr Arg Glu val Phe Ala Gin val Lys 
755 760 765 

Gin Met Tyr Lys Thr Pro Thr Leu Lys Tyr Phe Gly Gly Phe Asn Phe 
770 775 780 
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ser Gin lie Leu Pro Asp Pro Leu Lys Pro Thr Lys Arg ser Phe lie 
785 790 795 800 

Glu Asp Leu Leu Phe Asn Lys val Thr Leu Ala Asp Ala Gly Phe Met 
805 810 815 

Lys Gin Tyr Gly Glu Cys Leu Gly Asp lie Asn Ala Arg Asp Leu lie 
820 825 830 

Cys Ala Gin Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr 
835 840 845 

Asp Asp Met lie Ala Ala Tyr Thr Ala Ala Leu Val Ser Gly Thr Ala 
850 855 860 

Thr Ala Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gin lie Pro Phe 
865 870 875 880 

Ala Met Gin Met Ala Tyr Arg Phe Asn Gly lie Gly Val Thr Gin Asn 
885 890 895 

Val Leu Tyr Glu Asn Gin Lys Gin He Ala Asn Gin Phe Asn Lys Ala 
900 905 910 

lie ser Gin lie Gin Glu Ser Leu Thr Thr Thr Ser Thr Ala Leu Gly 
915 920 925 

Lys Leu Gin Asp val Val Asn Gin Asn Ala Gin Ala Leu Asn Thr Leu 
930 935 940 

val Lys Gin Leu Ser Ser Asn Phe Gly Ala lie ser Ser val Leu Asn 
945 950 955 960 

Asp lie Leu ser Arg Leu Asp Lys val Glu Ala Glu val Gin lie Asp 
965 970 975 

Arg Leu lie Thr Gly Arg Leu Gin Ser Leu Gin Thr Tyr val Thr Gin 
980 985 990 

Gin Leu lie Arg Ala Ala Glu lie Arg Ala Ser Ala Asn Leu Ala Ala 
995 ^ 1000 1005 

Thr Lys Met ser Glu cys val Leu Gly Gin Ser Lys Arg val Asp 
1010 1015 1020 

Phe cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gin Ala Ala 
1025 1030 1035 

Pro His Gly val val Phe Leu His Val Thr Tyr Val Pro Ser Gin 
1040 1045 1050 
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Glu Arg Asn Phe Thr Thr Ala Pro Ala He cys His Glu Gly Lys 
1055 1060 1065 



Ala Tyr Phe Pro Arg Glu Gly val Phe val Phe Asn Gly Thr ser 
1070 1075 1080 



Trp Phe lie Thr Gin Arg Asn Phe Phe Ser Pro Gin lie lie Thr 
1085 1090 1095 



Thr Asp Asn Thr Phe val ser Gly Asn cys Asp Val Val lie Gly 
1100 1105 1110 



lie lie Asn Asn Thr val Tyr Asp Pro Leu Gin Pro Glu Leu Asp 
1115 1120 1125 



ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser 
1130 1135 1140 



pro Asp val Asp Leu Gly Asp lie ser Gly lie Asn Ala ser Val 
1145 1150 1155 



val Asn lie Gin Lys Glu lie Asp Arg Leu Asn Glu Val Ala Lys 
1160 1165 1170 



Asn Leu Asn Glu ser Leu lie Asp Leu Gin Glu Leu Gly Lys Tyr 
1175 1180 1185 



Glu Gin Tyr He Lys Trp Pro Trp Tyr val Trp Leu Gly Phe lie 
1190 1195 1200 



Ala Gly Leu lie Ala lie Val Met Val Thr He Leu Leu cys cys 
1205 1210 1215 



Met Thr ser Cys Cys Ser cys Leu Lys Gly Ala Cys ser Cys Gly 
1220 1225 1230 



ser cys cys Lys Phe Asp Glu Asp Asp Ser Glu Pro val Leu Lys 



<210> 4 

<211> 3943 

<212> DNA 

<213> CORONAVIRUS 

<400> 4 



1235 



1240 



1245 



Gly val Lys 
1250 
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ctcttctgga aaaaggtagg cttatcatta gagaaaacaa cagagttgtg gtttcaagtg 60 

atattcttgt taacaactaa acgaacatgt ttattttctt attatttctt actctcacta 120 

gtggtagtga ccttgaccgg tgcaccactt ttgatgatgt tcaagctcct aattacactc 180 

aacatacttc atctatgagg ggggtttact atcctgatga aatttttaga tcagacactc 240 

tttatttaac tcaggattta tttcttccat tttattctaa tgttacaggg tttcatacta 300 

ttaatcatac gtttggcaac cctgtcatac cttttaagga tggtatttat tttgctgcca 360 

cagagaaatc aaatgttgtc cgtggttggg tttttggttc taccatgaac aacaagtcac 420 

agtcggtgat tattattaac aattctacta atgttgttat acgagcatgt aactttgaat 480 

tgtgtgacaa ccctttcttt gctgtttcta aacccatggg tacacagaca catactatga 540 

tattcgataa tgcatttaat tgcactttcg agtacatatc tgatgccttt tcgcttgatg 600 

tttcagaaaa gtcaggtaat tttaaacact tacgagagtt tgtgtttaaa aataaagatg 660 

ggtttctcta tgtttataag ggctatcaac ctatagatgt agttcgtgat ctaccttctg 720 

gttttaacac tttgaaacct atttttaagt tgcctcttgg tattaacatt acaaatttta 780 

gagccattct tacagccttt tcacctgctc aagacatttg gggcacgtca gctgcagcct 840 

attttgttgg ctatttaaag ccaactacat ttatgctcaa gtatgatgaa aatggtacaa 900 

tcacagatgc tgttgattgt tctcaaaatc cacttgctga actcaaatgc tctgttaaga 960 

gctttgagat tgacaaagga atttaccaga cctctaattt cagggttgtt ccctcaggag 1020 

atgttgtgag attccctaat attacaaact tgtgtccttt tggagaggtt tttaatgcta 1080 

ctaaattccc ttctgtctat gcatgggaga gaaaaaaaat ttctaattgt gttgctgatt 1140 

actctgtgct ctacaactca acattttttt caacctttaa gtgctatggc gtttctgcca 1200 

ctaagttgaa tgatctttgc ttctccaatg tctatgcaga ttcttttgta gtcaagggag 1260 

atgatgtaag acaaatagcg ccaggacaaa ctggtgttat tgctgattat aattataaat 1320 

tgccagatga tttcatgggt tgtgtccttg cttggaatac taggaacatt gatgctactt 1380 

caactggtaa ttataattat aaatataggt atcttagaca tggcaagctt aggccctttg 1440 

agagagacat atctaatgtg cctttctccc ctgatggcaa accttgcacc ccacctgctc 1500 

ttaattgtta ttggccatta aatgattatg gtttttacac cactactggc attggctacc 1560 

aaccttacag agttgtagta ctttcttttg aacttttaaa tgcaccggcc acggtttgtg 1620 

gaccaaaatt atccactgac cttattaaga accagtgtgt caattttaat tttaatggac 1680 

tcactggtac tggtgtgtta actccttctt caaagagatt tcaaccattt caacaatttg 1740 

gccgtgatgt ctctgatttc actgattccg ttcgagatcc taaaacatct gaaatattag 1800 

acatttcacc ttgctctttt gggggtgtaa gtgtaattac acctggaaca aatgcttcat 1860 

ctgaagttgc tgttctatat caagatgtta actgcactga tgtttctaca gcaatccatg 1920 

cagatcaact cacaccagct tggcgcatat attctactgg aaacaatgta ttccagactc 1980 

aagcaggctg tcttatagga gctgagcatg tcgacacttc ttatgagtgc gacattccta 2040 
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ttggagctgg catttgtgct agttaccata cagtttcttt attacgtagt actagccaaa 2100 

aatctattgt ggcttatact atgtctttag gtgctgatag ttcaattgct tactctaata 2160 

acaccattgc tatacctact aacttttcaa ttagcattac tacagaagta atgcctgttt 2220 

ctatggctaa aacctccgta gattgtaata tgtacatctg cggagattct actgaatgtg 2280 

ctaatttgct tctccaatat ggtagctttt gcacacaact aaatcgtgca ctctcaggta 2340 

ttgctgctga acaggatcgc aacacacgtg aagtgttcgc tcaagtcaaa caaatgtaca 2400 

aaaccccaac tttgaaatat tttggtggtt ttaatttttc acaaatatta cctgaccctc 2460 

taaagccaac taagaggtct tttattgagg acttgctctt taataaggtg acactcgctg 2520 

atgctggctt catgaagcaa tatggcgaat gcctaggtga tattaatgct agagatctca 2580 

tttgtgcgca gaagttcaat gggcttacag tgttgccacc tctgctcact gatgatatga 2640 

ttgctgccta cactgctgct ctagttagtg gtactgccac tgctggatgg acatttggtg 2700 

ctggcgctgc tcttcaaata ccttttgcta tgcaaatggc atataggttc aatggcattg 2760 

gagttaccca aaatgttctc tatgagaacc aaaaacaaat cgccaaccaa tttaacaagg 2820 

cgattagtca aattcaagaa tcacttacaa caacatcaac tgcattgggc aagctgcaag 2880 

acgttgttaa ccagaatgct caagcattaa acacacttgt taaacaactt agctctaatt 2940 

ttggtgcaat ttcaagtgtg ctaaatgata tcctttcgcg acttgataaa gtcgaggcgg 3000 

aggtacaaat tgacaggcta attacaggca gacttcaaag ccttcaaacc tatgtaacac 3060 

aacaactaat cagggctgct gaaatcaggg cttctgctaa tcttgctgct actaaaatgt 3120 

ctgagtgtgt tcttggacaa tcaaaaagag ttgacttttg tggaaagggc taccacctta 3180 

tgtccttccc acaagcagcc ccgcatggtg ttgtcttcct acatgtcacg tatgtgccat 3240 

cccaggagag gaacttcacc acagcgccag caatttgtca tgaaggcaaa gcatacttcc 3300 

ctcgtgaagg tgtttttgtg tttaatggca cttcttggtt tattacacag aggaacttct 3360 

tttctccaca aataattact acagacaata catttgtctc aggaaattgt gatgtcgtta 3420 

ttggcatcat taacaacaca gtttatgatc ctctgcaacc tgagcttgac tcattcaaag 3480 

aagagctgga caagtacttc aaaaatcata catcaccaga tgttgatctt ggcgacattt 3540 

caggcattaa cgcttctgtc gtcaacattc aaaaagaaat tgaccgcctc aatgaggtcg 3600 

ctaaaaattt aaatgaatca ctcattgacc ttcaagaatt gggaaaatat gagcaatata 3660 

ttaaatggcc ttggtatgtt tggctcggct tcattgctgg actaattgcc atcgtcatgg 3720 

ttacaatctt gctttgttgc atgactagtt gttgcagttg cctcaagggt gcatgctctt 3780 

gtggttcttg ctgcaagttt gatgaggatg actctgagcc agttctcaag ggtgtcaaat 3840 

tacattacac ataaacgaac ttatggattt gtttatgaga ttttttactc ttggatcaat 3900 

tactgcacag ccagtaaaaa ttgacaatgc ttctcctgca agt 3943 



<210> 5 
<211> 2049 
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<212> DNA 

<213> CORONAVIRUS 



<400> 5 
ctcttctgga 


aaaaggtagg 


cttatcatta 


gagaaaacaa 


cagagttgtg 


gtttcaagtg 


60 


atattcttgt 


taacaactaa 


acgaacatgt 


ttattttctt 


attatttctt 


actctcacta 


120 


gtggtagtga 


ccttgaccgg 


tgcaccactt 


ttgatgatgt 


tcaagctcct 


aattacactc 


180 


aacatacttc 


atctatgagg 


ggggtttact 


atcctgatga 


aatttttaga 


tcagacactc 


240 


tttatttaac 


tcaggattta 


tttcttccat 


tttattctaa 


tgttacaggg 


tttcatacta 


300 


ttaatcatac 


gtttggcaac 


cctgtcatac 


cttttaagga 


tggtatttat 


tttgctgcca 


360 


cagagaaatc 


aaatgttgtc 


cgtggttggg 


tttttggttc 


taccatgaac 


aacaagtcac 


420 


agtcggtgat 


tattattaac 


aattctacta atgttgttat 


acgagcatgt 


aactttgaat 


480 


tgtgtgacaa 


ccctttcttt 


gctgtttcta aacccatggg 


tacacagaca 


catactatga 


540 


tattcgataa 


tgcatttaat 


tgcactttcg 


agtacatatc 


tgatgccttt 


tcgcttgatg 


600 


tttcagaaaa 


gtcaggtaat 


tttaaacact 


tacgagagtt 


tgtgtttaaa 


aataaagatg 


660 


ggtttctcta 


tgtttataag 


ggctatcaac 


ctatagatgt 


agttcgtgat 


ctaccttctg 


720 


gttttaacac 


tttgaaacct 


atttttaagt tgcctcttgg 


tattaacatt 


acaaatttta 


780 


gagccattct 


tacagccttt 


tcacctgctc 


aagacatttg 


gggcacgtca 


gctgcagcct 


840 


attttgttgg 


ctatttaaag 


ccaactacat 


ttatgctcaa 


gtatgatgaa 


aatggtacaa 


900 


tcacagatgc 


tgttgattgt 


tctcaaaatc 


cacttgctga 


actcaaatgc 


tctgttaaga 


960 


gctttgagat 


tgacaaagga 


atttaccaga 


cctctaattt 


cagggttgtt 


ccctcaggag 


1020 


atgttgtgag 


attccctaat 


attacaaact 


tgtgtccttt 


tggagaggtt 


tttaatgcta 


1080 


ctaaattccc 


ttctgtctat 


gcatgggaga gaaaaaaaat 


ttctaattgt 


gttgctgatt 


1140 


actctgtgct 


ctacaactca 


acattttttt 


caacctttaa 


gtgctatggc 


gtttctgcca 


1200 


ctaagttgaa 


tgatctttgc 


ttctccaatg 


tctatgcaga 


ttcttttgta 


gtcaagggag 


1260 


atgatgtaag 


acaaatagcg 


ccaggacaaa 


ctggtgttat 


tgctgattat 


aattataaat 


1320 


tgccagatga 


tttcatgggt 


tgtgtccttg 


cttggaatac 


taggaacatt 


gatgctactt 


1380 


caactggtaa 


ttataattat 


aaatataggt 


atcttagaca 


tggcaagctt 


aggccctttg 


1440 


agagagacat 


atctaatgtg 


cctttctccc 


ctgatggcaa 


accttgcacc 


ccacctgctc 


1500 


ttaattgtta 


ttggccatta 


aatgattatg 


gtttttacac 


cactactggc 


attggctacc 


1560 


aaccttacag 


agttgtagta 


ctttcttttg 


aacttttaaa 


tgcaccggcc 


acggtttgtg 


1620 


gaccaaaatt 


atccactgac 


cttattaaga 


accagtgtgt 


caattttaat 


tttaatggac 


1680 


tcactggtac 


tggtgtgtta 


actccttctt 


caaagagatt 


tcaaccattt 


caacaatttg 


1740 


gccgtgatgt 


ctctgatttc 


actgattccg 


ttcgagatcc 


taaaacatct 


gaaatattag 


1800 
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acatttcacc ttgctctttt gggggtgtaa gtgtaattac acctggaaca aatgcttcat 1860 

ctgaagttgc tgttctatat caagatgtta actgcactga tgtttctaca gcaatccatg 1920 

cagatcaact cacaccagct tggcgcatat attctactgg aaacaatgta ttccagactc 1980 

aagcaggctg tcttatagga gctgagcatg tcgacacttc ttatgagtgc gacattccta 2040 
ttggagctg 



2049 



<210> 6 

<211> 2027 

<212> DNA 

<213> CORONAVIRUS 

<400> 6 

catgcagatc aactcacacc agcttggcgc atatattcta ctggaaacaa tgtattccag 60 

actcaagcag gctgtcttat aggagctgag catgtcgaca cttcttatga gtgcgacatt 120 

cctattggag ctggcatttg tgctagttac catacagttt ctttattacg tagtactagc 180 

caaaaatcta ttgtggctta tactatgtct ttaggtgctg atagttcaat tgcttactct 240 

aataacacca ttgctatacc tactaacttt tcaattagca ttactacaga agtaatgcct 300 

gtttctatgg ctaaaacctc cgtagattgt aatatgtaca tctgcggaga ttctactgaa 360 

tgtgctaatt tgcttctcca atatggtagc ttttgcacac aactaaatcg tgcactctca 420 

ggtattgctg ctgaacagga tcgcaacaca cgtgaagtgt tcgctcaagt caaacaaatg 480 

tacaaaaccc caactttgaa atattttggt ggttttaatt tttcacaaat attacctgac 540 

cctctaaagc caactaagag gtcttttatt gaggacttgc tctttaataa ggtgacactc 600 

gctgatgctg gcttcatgaa gcaatatggc gaatgcctag gtgatattaa tgctagagat 660 

ctcatttgtg cgcagaagtt caatgggctt acagtgttgc cacctctgct cactgatgat 720 

atgattgctg cctacactgc tgctctagtt agtggtactg ccactgctgg atggacattt 780 

ggtgctggcg ctgctcttca aatacctttt gctatgcaaa tggcatatag gttcaatggc 840 

attggagtta cccaaaatgt tctctatgag aaccaaaaac aaatcgccaa ccaatttaac 900 

aaggcgatta gtcaaattca agaatcactt acaacaacat caactgcatt gggcaagctg 960 

caagacgttg ttaaccagaa tgctcaagca ttaaacacac ttgttaaaca acttagctct 1020 

aattttggtg caatttcaag tgtgctaaat gatatccttt cgcgacttga taaagtcgag 1080 

gcggaggtac aaattgacag gttaattaca ggcagacttc aaagccttca aacctatgta 1140 

acacaacaac taatcagggc tgctgaaatc agggcttctg ctaatcttgc tgctactaaa 1200 

atgtctgagt gtgttcttgg acaatcaaaa agagttgact tttgtggaaa gggctaccac 1260 

cttatgtcct tcccacaagc agccccgcat ggtgttgtct tcctacatgt cacgtatgtg 1320 

ccatcccagg agaggaactt caccacagcg ccagcaattt gtcatgaagg caaagcatac 1380 
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ggcacttctt ggtttattac acagaggaac 


1440 


ttcttttctc 


cacaaataat 


tactacagac 


aatacatttg 


tctcaggaaa ttgtgatgtc 


15O0 


gttattggcg 


tcattaacaa 


cacagtttat 


gatcctctgc 


aacctgagct 


tgactcattc 


1560 


aaagaagagc 


tggacaagta 


cttcaaaaat 


catacatcac 


cagatgttga tcttggcgac 


1620 


atttcaggca 


ttaacgcttc 


tgtcgtcaac 


attcaaaaag 


aaattgaccg 


cctcaatgag 


1680 


gtcgctaaaa 


atttaaatga 


atcactcatt 


gaccttcaag 


aattgggaaa 


atatgagcaa 


1740 


tatattaaat 


ggccttggta 


tgtttggctc 


ggcttcattg 


ctggactaat 


tgccatcgtc 


18O0 


augg u xacaa 


LCLxgc l l x.g 


I XyCalyaCI 


agttgttgca 


gttgcctcaa 


gggtgcatgc 


IOOw 


tcttgtggtt 


cttgctgcaa 


gtttgatgag 


gatgactctg 


agccagttct 


caagggtgtc 


1920 


aaattacatt 


acacataaac 


gaacttatgg 


atttgtttat 


gagatttttt 


actcttggat 


1980 


caattactgc 


acagccagta 


aaaattgaca 


atgcttctcc 


tgcaagt 




2027 


<210> 7 














<211> 1096 












<212> DNA 














<213> CORONAVIRUS 












<400> 7 
tcttgctttg 


ttgcatgact 


agttgttgca 


gttgcctcaa 


gggtgcatgc 


tcttgtggtt 


60 


cttgctgcaa 


gtttgatgag 


gatgactctg 


agccagttct 


caagggtgtc 


aaattacatt 


120 


acacataaac 


gaacttatgg 


atttgtttat 


gagatttttt 


actcttggat 


caattactgc 


180 


acagccagta 


aaaattgaca 


atgcttctcc 


tgcaagtact 


gttcatgcta 


cagcaacgat 


240 


accgctacaa 


gcctcactcc 


ctttcggatg 


gcttgttatt 


ggcgttgcat 


ttcttgctgt 


300 


ttttcagagc 


gctaccaaaa 


taattgcgct 


caataaaaga 


tggcagctag 


ccctttataa 


360 


gggcttccag 


ttcatttgca 


atttactgct 


gctatttgtt 


accatctatt 


cacatctttt 


420 


gcttgtcgct 


gcaggtatgg 


aggcgcaatt 


tttgtacctc 


tatgccttga tatattttct 


480 


acaatgcatc 


aacgcatgta 


gaattattat 


gagatgttgg 


ctttgttgga agtgcaaatc 


540 


caagaaccca 


ttactttatg 


atgccaacta 


ctttgtttgc 


tggcacacac 


ataactatga 


6O0 


ctactgtata 


ccatataaca 


gtgtcacaga 


tacaattgtc 


gttactgaag 


gtgacggcat 


660 


ttcaacacca 


aaactcaaag 


aagactacca 


aattggtggt 


tattctgagg 


ataggcactc 


720 


aggtgttaaa 


gactatgtcg 


ttgtacatgg 


ctatttcacc 


gaagtttact 


accagcttga 


780 


gtctacacaa 


attactacag 


acactggtat 


tgaaaatgct 


acattcttca 


tctttaacaa 


840 


gcttgttaaa 


gacccaccga 


atgtgcaaat 


acacacaatc 


gacggctctt 


caggagttgc 


900 


taatccagca 


atggatccaa 


tttatgatga 


gccgacgacg 


actactagcg 


tgcctttgta 


960 


agcacaagaa 


agtgagtacg 


aacttatgta 


ctcattcgtt 


tcggaagaaa 


caggtacgtt 


1020 
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aatagttaat 


agcgtacttc 


S226CASU1. 
tttttcttgc tttcgtggta 


ST25 

ttcttgctag 


tcacactagc 


1080 


catccttact 


gcgctt 








1096 


<210> 8 












<211> 1135 










<212> DNA 












<213> CORONAVIRUS 










<4UU> o 

attgccatcg 


tcatggttac 


aatcttgctt tgttgcatga 


ctagttgttg 


cagttgcctc 


60 


aagggtgcat 


gctcttgtgg 


ttcttgctgc aagtttgatg 


aggatgactc 


tgagccagtt 


120 


ctcaagggtg 


tcaaattaca 


ttacacataa acgaacttat 


ggatttgttt 


atgagatttt 


180 


ttactcttgg 


atcaattact 


gcacagccag taaaaattga 


caatgcttct 


cctgcaagta 


240 


ctgttcatgc 


tacagcaacg 


ataccgctac aagcctcact 


ccctttcgga 


tggcttgtta 


300 


ttggcgttgc 


atttcttgct 


gtttttcaga gcgctaccaa 


aataattgcg 


ctcaataaaa 


360 


gatggcagct 


agccctttat 


aagggcttcc agttcatttg 


caatttactg 


ctgctatttg 


420 


ttaccatcta 


ttcacatctt 


ttgcttgtcg ctgcaggtat 


ggaggcgcaa 


trtttgtacc 


480 


tctatgcctt 


gatatatttt 


ctacaatgca tcaacgcatg 


tagaattatt 


atgagatgtt 


540 


ggctttgttg 


gaagtgcaaa 


tccaagaacc cattacttta 


tgatgccaac 


tactttgttt 


600 


gctggcacac 


acataactat 


gactactgta taccatataa 


cagtgtcaca 


gatacaattg 


660 


tcgttactga 


aggtgacggc 


atttcaacac caaaactcaa 


agaagactac 


caaattggtg 


720 


gttattctga 


ggataggcac 


tcaggtgtta aagactatgt 


cgttgtacat 


ggctatttca 


780 


ccgaagttta 


ctaccagctt 


gagtctacac aaattactac 


agacactggt 


atngaaaatg 


840 


ctacattctt 


catctttaac 


aagcttgtta aagacccacc 


gaatgtgcaa 


atacacacaa 


900 


tcgacggctc 


ttcaggagtt 


gctaatccag caatggatcc 


aatttatgat 


gagccgacga 


960 


cgactactag 


cgtgcctttg 


taagcacaag aaagtgagta 


cgaacttatg 


tactcattcg 


1020 


tttcggaaga 


aacaggtacg 


ttaatagtta atagcgtact 


tctttttctt 


gctttcgtgg 


1080 


tattcttgct 


agtcacacta 


gccatcctta ctgcgcttcg 


attgtgtgcg 


tactg 


1135 



<210> 9 

<211> 1096 

<212> DNA 

<213> CORONAVIRUS 

<220> 

<221> CDS 
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<222> (137).. (958) 
<223> 



<400> 9 

tcttgctttg ttgcatgact agttgttgca gttgcctcaa gggtgcatgc tcttgtggtt 60 

cttgctgcaa gtttgatgag gatgactctg agccagttct caagggtgtc aaattacatt 120 

acacataaac gaactt atg gat ttg ttt atg aga ttt ttt act ctt gga tea 172 

Met Asp Leu Phe Met Arg Phe Phe Thr Leu Gly Ser 

1 5 ~' 10 

att act gca cag cca gta aaa att gac aat get tct cct gca agt act 220 
lie Thr Ala Gin Pro Val Lys lie Asp Asn Ala Ser Pro Ala Ser Thr 
15 20 25 

gtt cat get aca gca acg ata ccg eta caa gec tea etc cct ttc gga 268 
val His Ala Thr Ala Thr lie Pro Leu Gin Ala Ser Leu Pro Phe Gly 
30 35 40 

tgg ctt gtt att ggc gtt gca ttt ctt get gtt ttt cag age get acc 316 
Trp Leu val He Gly val Ala Phe Leu Ala val Phe Gin Ser Ala Thr 
45 50 55 60 

aaa ata att gcg etc aat aaa aga tgg cag eta gee ctt tat aag ggc 364 
Lys lie lie Ala Leu Asn Lys Arg Trp Gin Leu Ala Leu Tyr Lys Gly 
65 70 75 

ttc cag ttc att tgc aat tta ctg ctg eta ttt gtt acc ate tat tea 412 
Phe Gin Phe lie cys Asn Leu Leu Leu Leu Phe val Thr lie Tyr ser 
80 85 90 

cat ctt ttg ctt gtc get gca ggt atg gag gcg caa ttt ttg tac etc 460 
His Leu Leu Leu val Ala Ala Gly Met Glu Ala Gin Phe Leu Tyr Leu 
95 100 105 

tat gee ttg ata tat ttt eta caa tgc ate aac gca tgt aga att att 508 
Tyr Ala Leu lie Tyr Phe Leu Gin cys lie Asn Ala cys Arg lie rle 
110 115 120 

atg aga tgt tgg ctt tgt tgg aag tgc aaa tec aag aac cca tta ctt 556 
Met Arg Cys Trp Leu cys Trp Lys Cys Lys Ser Lys Asn Pro Leu Leu 
125 130 135 140 

tat gat gee aac tac ttt gtt tgc tgg cac aca cat aac tat gac tac 604 
Tyr Asp Ala Asn Tyr Phe Val Cys Trp His Thr His Asn Tyr Asp Tyr 
145 150 155 

tgt ata cca tat aac agt gtc aca gat aca att gtc gtt act gaa ggt 652 
Cys lie Pro Tyr Asn ser val Thr Asp Thr lie Val val Thr Glu Gly 
160 165 170 

gac ggc att tea aca cca aaa etc aaa gaa gac tac caa att ggt ggt 700 
Asp Gly lie Ser Thr Pro Lys Leu Lys Glu Asp Tyr Gin lie Gly Gly 
175 180 185 

tat tct gag gat agg cac tea ggt gtt aaa gac tat gtc gtt gta cat 748 
Tyr Ser Glu Asp Arg His Ser Gly Val Lys Asp Tyr Val Val Val His 
190 195 200 

ggc tat ttc acc gaa gtt tac tac cag ctt gag tct aca caa att act 796 
Gly Tyr Phe Thr Glu Val Tyr Tyr Gin Leu Glu Ser Thr Gin lie Thr 
205 210 215 220 
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aca gac act ggt att gaa aat get aca ttc ttc ate ttt aac aag ctt 
Thr Asp Thr Gly lie Glu Asn Ala Thr Phe Phe lie Phe Asn Lys Leu 
225 230 235 



gtt aaa gac cca ccg aat gtg caa ata cac aca ate gac ggc tct tea 

val Lys Asp Pro Pro Asn val Gin lie His Thr lie Asp Gly ser Ser 
240 245 250 

gga gtt get aat cca gca atg gat cca att tat gat gag ccg acg acg 

Gly val Ala Asn Pro Ala Met Asp Pro lie Tyr Asp Glu Pro Thr Thr 
255 260 265 



<210> 


10 


<211> 


274 


<212> 


PRT 


<213> 


CORONAVIRUS 


<400> 


10 



Met Asp Leu Phe Met Arg Phe Phe Thr Leu Gly Ser lie Thr Ala Gin 
15 10 15 

Pro val Lys lie Asp Asn Ala ser Pro Ala ser Thr Val His Ala Thr 
20 25 30 

Ala Thr lie Pro Leu Gin Ala Ser Leu Pro Phe Gly Trp Leu Val lie 
35 40 45 

Gly val Ala Phe Leu Ala val Phe Gin ser Ala Thr Lys lie He Ala 
50 55 60 

Leu Asn Lys Arg Trp Gin Leu Ala Leu Tyr Lys Gly Phe Gin Phe lie 

65 70 75 80 

cys Asn Leu Leu Leu Leu Phe Val Thr lie Tyr Ser His Leu Leu Leu 
85 90 95 

val Ala Ala Gly Met Glu Ala Gin Phe Leu Tyr Leu Tyr Ala Leu lie 
100 105 110 

Tyr Phe Leu Gin cys lie Asn Ala cys Arg lie lie Met Arg Cys Trp 
115 120 ~ 125 

Leu cys Trp Lys Cys Lys ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn 
130 135 140 
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844 



892 



940 



act act age gtg cct ttg taagcacaag aaagtgagta cgaacttatg 988 
Thr Thr Ser Val Pro Leu 
270 

tactcattcg ttteggaaga aacaggtacg ttaatagtta atagegtact tctttttctt 1048 
gctttcgtgg tattcttget agtcacacta gccatcctta ctgegett 1096 
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Tyr Phe val cys Trp His Thr His Asn Tyr Asp Tyr cys lie Pro Tyr 
145 150 155 160 

Asn Ser Val Thr Asp Thr He val val Thr Glu Gly Asp Gly He ser 
165 170 175 

Thr Pro Lys Leu Lys Glu Asp Tyr Gin lie Gly Gly Tyr ser Glu Asp 
180 185 190 

Arg His ser Gly val Lys Asp Tyr Val Val val His Gly Tyr Phe Thr 
195 200 205 

Glu Val Tyr Tyr Gin Leu Glu Ser Thr Gin lie Thr Thr Asp Thr Gly 
210 215 220 

lie Glu Asn Ala Thr Phe Phe lie Phe Asn Lys Leu Val Lys Asp Pro 
225 230 235 240 

Pro Asn Val Gin lie His Thr lie Asp Gly Ser Ser Gly Val Ala Asn 
245 250 255 

Pro Ala Met. Asp Pro lie Tyr Asp Glu Pro Thr Thr Thr Thr Ser Val 
260 265 270 

Pro Leu 

<210> 11 

<211> 1096 

<212> DNA 

<213> CORONAVIRUS 

<220> 

<221> CDS 

<222> (558) . . (1019) 

<223> 

<400> 11 

tcttgctttg ttgcatgact agttgttgca gttgcctcaa gggtgcatgc tcttgtggtt 60 

cttgctgcaa gtttgatgag gatgactctg agccagttct caagggtgtc aaattracatt 120 

acacataaac gaacttatgg atttgtttat gagatttttt actcttggat caattactgc 180 

acagccagta aaaattgaca atgcttctcc tgcaagtact gttcatgcta cagcaacgat 240 

accgctacaa gcctcactcc ctttcggatg gcttgttatt ggcgttgcat ttctngctgt 300 
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ttttcagagc gctaccaaaa taattgcgct caataaaaga tggcagctag ccctttataa 

gggcttccag ttcatttgca atttactgct gctatttgtt accatctatt cacatctttt 

gcttgtcgct gcaggtatgg aggcgcaatt tttgtacctc tatgccttga tatattttct 

acaatgcatc aacgcatgta gaattattat gagatgttgg ctttgttgga agtgcaaatc 

caagaaccca ttacttt atg atg cca act act ttg ttt get ggc aca cac 

Met Met Pro Thr Thr Leu Phe Ala Gly Thr His 
15 10 

ata act atg act act gta tac cat ata aca gtg tea cag ata caa ttg 
lie Thr Met Thr Thr val Tyr His lie Thr val Ser Gin lie Gin Leu 
15 20 25 

teg tta ctg aag gtg acg gca ttt caa cac caa aac tea aag aag act 
ser Leu Leu Lys VaT Thr Ala Phe Gin His Gin Asn Ser Lys Lys Thr 



30 



35 



40 



ace aaa ttg gtg gtt att ctg agg ata ggc act cag gtg tta aag act 

Thr Lys Leu val Val lie Leu Arg lie Gly Thr Gin Val Leu Lys Thr 
45 50 55 

atg teg ttg tac atg get att tea ccg aag ttt act acc age ttg agt 

Met Ser Leu Tyr Met Ala lie Ser Pro Lys Phe Thr Thr ser Leu Ser 

60 65 70 75 

eta cac aaa tta eta cag aca ctg gta ttg aaa atg eta cat tct tea 

Leu His Lys Leu Leu Gin Thr Leu Val Leu Lys Met Leu His Ser ser 

80 85 90 

tct tta aca age ttg tta aag acc cac cga atg tgc aaa tac aca caa 

ser Leu Thr Ser Leu Leu Lys Thr His Arg Met cys Lys Tyr Thr Gin 

95 100 105 

teg acg get ctt cag gag ttg eta ate cag caa tgg ate caa ttt at:g 

ser Thr Ala Leu Gin Glu Leu Leu lie Gin Gin Trp lie Gin Phe Met 
110 115 120 

atg age cga cga cga eta eta gcg tgc ctt tgt aag cac aag aaa gt:q 

Met ser Arg Arg Arg Leu Leu Ala cys Leu cys Lys His Lys Lys val 
125 130 135 

agt acg aac tta tgt act cat teg ttt egg aag aaa cag gta cgt 

Ser Thr Asn Leu Cys Thr His ser Phe Arg Lys Lys Gin Val Arg 

140 145 150 

taatagttaa tagegtaett ctttttcttg ctttcgtggt attcttgeta gtcacactag 
ccatccttac tgegett 



360 
420 
480 
540 
590 

638 

686 

734 

782 

830 

878 

926 

974 

1019 

1079 
1096 



<210> 12 

<211> 154 

<212> PRT 

<213> CORONAVIRUS 

<400> 12 

Met Met Pro Thr Thr Leu Phe Ala Gly Thr His lie Thr Met Thr Thr 
1 5 10 15 
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Val Tyr His lie Thr val ser Gin He Gin Leu ser Leu Leu Lys Val 
20 25 30 

Thr Ala Phe Gin His Gin Asn Ser Lys Lys Thr Thr Lys Leu Val val 
35 40 45 

lie Leu Arg lie Gly Thr Gin val Leu Lys Thr Met Ser Leu Tyr Met 
50 55 60 

Ala He ser Pro Lys Phe Thr Thr ser Leu ser Leu His Lys Leu Leu 
65 70 75 80 

Gin Thr Leu val Leu Lys Met Leu His Ser Ser Ser Leu Thr Ser Leu 
85 90 95 

Leu Lys Thr His Arg Met Cys Lys Tyr Thr Gin Ser Thr Ala Leu Gin 
100 105 110 

Glu Leu Leu lie Gin Gin Trp lie Gin Phe Met Met Ser Arg Arg Arg 
115 120 125 

Leu Leu Ala cys Leu cys Lys His Lys Lys Val Ser Thr Asn Leu Cys 
130 135 140 

Thr His Ser Phe Arg Lys Lys Gin val Arg 
145 150 

<210> 13 

<211> 332 

<212> DNA 

<213> CORONAVIRUS 



<220> 

<221> CDS 

<222> (36).. (263) 

<223> 



<400> 13 

tgcctttgta agcacaagaa agtgagtacg aactt atg tac tea ttc gtt teg 55 

Met Tyr ser Phe val Ser 
1 5 

gaa gaa aca ggt acg tta ata gtt aat age gta ctt ctt ttt ctt get 101 
Glu Glu Thr Gly Thr Leu lie val Asn ser val Leu Leu Phe Leu Ala 
10 15 20 



ttc gtg gta ttc ttg eta gtc aca eta gec ate ctt act gcg ctt cga 
Phe val val Phe Leu Leu val Thr Leu Ala He Leu Thr Ala Leu Arg 
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<210> 


15 


<211> 


332 


<212> 


DNA 


<213> 


CORONAVIRUS 


<400> 


15 



197 



245 



S226CAS111-ST25 
25 30 35 

ttg tgt gcg tac tgc tgc aat att gtt aac gtg agt tta gta aaa cca 
Leu cys Ala Tyr cys cys Asn He val Asn VaT Ser Leu val Lys Pro 
40 45 50 

acg gtt tac gtc tac teg cgt gtt aaa aat ctg aac tct tct gaa gqa 
Thr val Tyr val Tyr ser Arg val Lys Asn Leu Asn ser ser Glu Gly 
55 60 65 70 

gtt cct gat ctt ctg gtc taaacgaact aactattatt attattctgt 293 
val Pro Asp Leu Leu val 
75 

ttggaacttt aacattgett atcatggcag acaaeggta 332 

<210> 14 

<211> 76 

<212> PRT 

<213> CORONAVIRUS 



<400> 14 

Met Tyr Ser Phe val Ser Glu Glu Thr Gly Thr Leu lie Val Asn ser 
15 10 15 

Val Leu Leu Phe Leu Ala Phe Val val Phe Leu Leu Val Thr Leu Ala 
20 25 30 

lie Leu Thr Ala Leu Arg Leu Cys Ala Tyr cys Cys Asn lie val Asn 
35 40 45 

val ser Leu val Lys Pro Thr val Tyr val Tyr Ser Arg val Lys Asn 
50 ' 55 60 



70 75 



tgcctttgta agcacaagaa agtgagtacg aacttatgta etcattegtt teggaagaaa 60 

caggtaegtt aatagttaat agegtactte tttttcttgc tttcgtggta ttcttgetag 120 

tcacactagc catccttact gegcttcgat tgtgtgcgta ctgctgcaat attgttaacg 180 

tgagtttagt aaaaccaacg gtttaegtet actcgcgtgt taaaaatctg aactcttctg 240 
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aaggagttcc tgatcttctg gtctaaacga actaactatt attattattc tgtttggaac 300 
tttaacattg cttatcatgg cagacaacgg ta 332 

<210> 16 

<211> 708 

<212> DNA 

<213> CORONAVIRUS 



<220> 

<221> CDS 

<222> (41) . . C703) 

<223> 



<400> 16 

tattattatt attctgtttg gaactttaac attgcttatc atg gca gac aac ggt 55 

' Met Ala Asp Asn Gly 

1 5 

act att acc gtt gag gag ctt aaa caa etc ctg gaa caa tgg aac eta 103 
Thr He Thr Val Glu Glu Leu Lys Gin Leu Leu Glu Gin Trp Asn Leu 
10 15 20 

gta ata ggt ttc eta ttc eta gee tgg att atg tta eta caa ttt gee 
val lie Gly Phe Leu Phe Leu Ala Trp lie Met Leu Leu Gin Phe Ala 
25 30 35 

tat tct aat egg aac agg ttt ttg tac ata ata aag ctt gtt ttc etc 
Tyr Ser Asn Arg Asn Arg Phe Leu Tyr lie lie Lys Leu val Phe Leu 
40 "45 50 

tgg etc ttg tgg cca gta aca ctt get tgt ttt gtg ctt get get gtc 
Trp Leu Leu Trp Pro val Thr Leu Ala cys Phe val Leu Ala Ala van 
55 60 65 

tac aga att aat tgg gtg act ggc ggg att gcg att gca atg get tgt 
Tyr Arg lie Asn Trp val Thr Gly Gly lie Ala lie Ala Met Ala cys 
70 75 80 85 

att gta ggc ttg atg tgg ctt age tac ttc gtt get tec ttc agg ctg 
lie val Gly Leu Met Trp Leu Ser Tyr Phe Val Ala ser Phe Arg Leu 
90 95 100 

ttt get cgt acc cgc tea atg tgg tea ttc aac cca gaa aca aac att 391 
Phe Ala Arg Thr Arg ser Met Trp Ser Phe Asn Pro Glu Thr Asn lie 
105 110 115 



ctt etc aat gtg cct etc egg ggg aca att gtg acc aga ccg etc atg 
Leu Leu Asn val Pro Leu Arg Gly Thr lie Val Thr Arg Pro Leu Met 
120 125 130 

gaa agt gaa ctt gtc att ggt get gtg ate att cgt ggt cac ttg cga 
Glu ser Glu Leu val lie Gly Ala val lie lie Arg Gly His Leu Arg 
135 140 145 



151 



199 



247 



295 



343 



atg gee gga cac tec eta ggg cgc tgt gac att aag gac ctg cca aaa 
Met Ala Gly His ser Leu Gly Arg cys Asp He Lys Asp Leu Pro Lys 
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150 155 160 165 

gag ate act gtg get aca tea cga acg ctt tct tat tac aaa tta gga 
Glu lie Thr VaT Ala Thr ser Arg Thr Leu ser Tyr Tyr Lys Leu Gly 
170 175 180 

gcg teg cag cgt gta ggc act gat tea ggt ttt get gca tac aac cgc 
Ala Ser Gin Arg Val Gly Thr Asp Ser Gly Phe Ala Ala Tyr Asn Arg 
185 190 195 

tac cgt att gga aac tat aaa tta aat aca gac cac gee ggt age aac 
Tyr Arq lie Gly Asn Tyr Lys Leu Asn Thr Asp His Ala Gly Ser Asn 
200 205 210 

gac aat att get ttg eta gta cag taagt 
Asp Asn lie Ala Leu Leu val Gin 
215 220 

<210> 17 

<211> 221 

<212> PRT 

<213> CORONAVIRUS 



<400> 17 

Met Ala Asp Asn Gly Thr lie Thr val Glu Glu Leu Lys Gin Leu Leu 
15 10 15 

Glu Gin Trp Asn Leu val lie Gly Phe Leu Phe Leu Ala Trp lie Met 
20 25 30 

Leu Leu Gin Phe Ala Tyr Ser Asn Arg Asn Arg Phe Leu Tyr lie lie 
35 40 45 

Lys Leu val Phe Leu Trp Leu Leu Trp Pro val Thr Leu Ala cys Phe 
50 55 60 

val Leu Ala Ala Val Tyr Arg lie Asn Trp val Thr Gly Gly lie Ala 
65 70 75 80 

lie Ala Met Ala cys He val Gly Leu Met Trp Leu ser Tyr Phe val 
85 90 95 

Ala ser Phe Arg Leu phe Ala Arg Thr Arg Ser Met Trp Ser Phe Asn 
100 105 110 

Pro Glu Thr Asn lie Leu Leu Asn val Pro Leu Arg Gly Thr lie val 
115 120 125 

Thr Arg Pro Leu Met Glu ser Glu Leu val lie Gly Ala val lie lie 
130 135 140 



583 
631 
679 
708 



Arg Gly His Leu Arg Met Ala Gly His ser Leu Gly Arg cys Asp lie 
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160 



i_ys Asp Leu Pro Lys Glu He Thr val Ala Thr ser Arg Thr Leu ser 
165 170 175 

Tyr Tyr Lys Leu Gly Ala Ser Gin Arg val Gly Thr Asp ser Gly Phe 
180 185 190 

Ala Ala Tyr Asn Arg Tyr Arg lie Gly Asn Tyr Lys Leu Asn Thr Asp 
195 200 205 

His Ala Gly ser Asn Asp Asn lie Ala Leu Leu val Gin 
210 215 220 

<210> 18 

<211> 769 

<212> DNA 

<213> CORONAVIRUS 



<400> 18 
cctgatcttc 


tggtctaaac 


gaactaacta 


ttattattat 


tctgtttgga 


actttaacat 


60 


tgcttatcat 


ggcagacaac 


ggtactatta 


ccgttgagga 


gcttaaacaa 


ctcctggaac 


120 


aatggaacct 


agtaataggt 


ttcctattcc 


tagcctggat 


tatgttacta 


caatttgcct 


180 


attctaatcg 


gaacaggttt 


ttgtacataa 


taaagcttgt 


tttcctctgg 


ctcttgtggc 


240 


cagtaacact 


tgcttgtttt 


gtgcttgctg 


ctgtctacag 


aattaattgg 


gtgactggcg 


3O0 


ggattgcgat 


tgcaatggct 


tgtattgtag 


gcttgatgtg 


gcttagctac 


ttcgttgctt 


3 60 


ccttcaggct 


gtttgctcgt 


acccgctcaa 


tgtggtcatt 


caacccagaa 


acaaacattc 


420 


ttctcaatgt 


gcctctccgg 


gggacaattg 


tgaccagacc 


gctcatggaa agtgaacttg 


480 


tcattggtgc 


tgtgatcatt 


cgtggtcact 


tgcgaatggc 


cggacactcc 


ctagggcgct 


540 


gtgacattaa 


ggacctgcca 


aaagagatca 


ctgtggctac 


atcacgaacg 


ctttcttatt 


600 


acaaattagg 


agcgtcgcag 


cgtgtaggca 


ctgattcagg 


ttttgctgca tacaaccgct 


660 


accgtattgg 


aaactataaa 


ttaaatacag 


accacgccgg 


tagcaacgac 


aatattgctt 


720 


tgctagtaca 


gtaagtgaca 


acagatgttt 


catcttgttg 


acttccagg 




7 69 



<210> 19 

<211> 1231 

<212> DNA 

<213> CORONAVIRUS 



<400> 19 
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taccgtattg 


gaaactataa 


attaaataca 


gaccacgccg gtagcaacga caatattgct 


60 


ttgctagtac 


agtaagtgac 


aacagatgtt tcatcttgtt gacttccagg ttacaatagc 


120 


agagatattg 


attatcatta 


tgaggacttt caggattgct atttggaatc ttgacgttat 


180 


aataagttca 


atagtgagac 


aattatttaa 


gcctctaact aagaagaatt attcggagtt 


240 


agatgatgaa 


gaacctatgg 


agttagatta 


tccataaaac gaacatgaaa attattctct 


300 


tcctgacatt 


gattgtattt 


acatcttgcg 


agctatatca ctatcaggag tgtgttagag 


360 


gtacgactgt 


actactaaaa 


gaaccttgcc 


catcaggaac atacgagggc aattcaccat 


420 


ttcaccctct 


tgctgacaat 


aaatttgcac 


taacttgcac tagcacacac tttgcttttg 


480 


cttgtgctga 


cggtactcga 


catacctatc 


agctgcgtge aagatcagtt tcaccaaaac 


540 


ttttcatcag 


acaagaggag 


gttcaacaag 


agctctactc gccacttttt ctcattgttg 


600 


ctgctctagt 


atttttaata 


ctttgcttca 


ccattaagag aaagacagaa tgaatgagct 


660 


cactttaatt 


gacttctatt 


tgtgcttttt 


agcctttctg ctattccttg ttttaataat 


720 


gcttattata 


ttttggtttt 


cactcgaaat ccaggatcta gaagaacctt gtaccaaagt 


780 


ctaaacgaac 


atgaaacttc 


tcattgtttt gacttgtatt tctctatgca gttgcatatg 


840 


cactgtagta 


cagcgctgtg 


catctaataa 


acctcatgtg cttgaagatc cttgtaaggt 


900 


acaacactag 


gggtaatact 


tatagcactg cttggctttg tgctctagga aaggttttac 


960 


cttttcatag 


atggcacact 


atggttcaaa 


catgcacacc taatgttact atcaactgtc 


1020 


aagatccagc 


tggtggtgcg 


cttatagcta ggtgttggta ccttcatgaa ggtcaccaaa 


1080 


ctgctgcatt 


tagagacgta 


cttgttgttt 


taaataaacg aacaaattaa aatgtctgat 


1140 


aatggacccc 


aatcaaacca 


acgtagtgcc 


ccccgcatta catttggtgg acccacagat 


1200 


tcaactgaca 


ataaccagaa 


tggaggacgc 


a 


1231 


<210> 20 










<211> 1242 








<212> DNA 










<213> CORONAVIRUS 








<400> 20 

gcatacaacc gctaccgtat 


tggaaactat 


aaattaaata cagaccacgc cggtagcaac 


60 


gacaatattg 


ctttgctagt 


acagtaagtg 


acaacagatg tttcatcttg ttgacttcca 


120 


ggttacaata gcagagatat 


tgattatcat 


tatgaggact ttcaggattg ctatttggaa 


180 


tcttgacgtt ataataagtt 


caatagtgag 


acagttattt aagcctctaa ctaagaagaa 


240 


ttattcggag 


ttagatgatg 


aagaacctat 


ggagttagat tatccataaa acgaacatga 


300 


aaattattct 


cttcctgaca 


ttgattgtat 


ttacatcttg cgagctatat cactatcagg 


360 


agtgtgttag aggtacgact 


gtactactaa 


aagaaccttg cccatcagga acatacgagg 


420 
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ataaatttgc actaacttgc 


actagcacac 


480 


actttgcttt 


tgcttgtgct 


gacggtactc 


gacataccta 


tcagctgcgt 


gcaagatcag 


540 


tttcaccaaa 


acttttcatc 


agacaagagg 


aggttcaaca 


agagctctac 


tcgccacttt 


600 


ttctcattgt 


tgctgctcta 


gtatttttaa 


tactttgctt 


caccattaag 


agaaagacag 


660 


aatgaatgag 


ctcactttaa 


ttgacttcta 


tttgtgcttt 


ttagcctttc 


tgctattcct 


720 


tgttttaata 


atgcttatta 


tattttggtt 


ttcactcgaa 


atccaggatc 


tagaagaacc 


780 


ttgtaccaaa 


gtctaaacga 


acatgaaact 


tctcattgtt 


ttgacttgta 


tttctctatg 


840 


cagttgcata 


tgcactgtag 


tacagcgctg 


tgcatctaat 


aaacctcatg 


tgcttgaaga 


900 


tccttgtaag 


gtacaacact 


aggggtaata 


cttatagcac 


tgcttggctt 


tgtgctctag 


960 


gaaaggtttt 


accttttcat 


agatggcaca 


ctatggttca 


aacatgcaca 


cctaatgtta 


1020 


ctatcaactg 


tcaagatcca 


gctggtggtg 


cgcttatagc 


taggtgttgg 


taccttcatg 


1080 


aaggtcacca 


aactgctgca 


tttagagacg 


tacttgttgt 


tttaaataaa 


cgaacgaatt 


1140 


aaaatgtctg 


ataatggacc 


ccaatcaaac 


caacgtagtg 


ccccccgcat 


tacatttggt 


1200 


ggacccacag 


attcaactga 


caataaccag 


aatggaggac 


gc 




1242 



<210> 21 

<211> 1231 

<212> DNA 

<213> CORONAVIRUS 

<220> 

<221> CDS 

<222> (86) -.(274) 

<223> 

<400> 21 

taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 60 

ttgctagtac agtaagtgac aacag atg ttt cat ctt gtt gac ttc cag gtt 112 

Met Phe His Leu Val Asp Phe Gin val 
1 5 

aca ata gca gag ata ttg att ate att atg agg act ttc agg att get 160 

Thr lie Ala Glu lie Leu lie lie lie Met Arg Thr Phe Arg lie Ala 

10 15 20 25 

att tgg aat ctt gac gtt ata ata agt tea ata gtq aga caa tta ttt 208 
lie Trp Asn Leu Asp val lie lie ser Ser lie Val Arg Gin Leu Phe 
30 35 40 

aag cct eta act aag aag aat tat teg gag tta gat gat gaa gaa cct 256 
Lys pro Leu Thr Lys Lys Asn Tyr ser Glu Leu Asp Asp Glu Glu Pro 
45 50 55 

Page 43 



WO 2005/056781 



PCT/FR2004/003105 



S226CASU1.ST25 

atg gag tta gat tat cca taaaacgaac atgaaaatta ttctcttcct 304 
Met Glu Leu Asp Tyr Pro 
60 

gacattgatt gtatttacat cttgcgagct atatcactat caggagtgtg ttagaggtac 364 

gactgtacta ctaaaagaac cttgcccatc aggaacatac gagggcaatt caccatttca 424 

ccctcttgct gacaataaat ttgcactaac ttgcactagc acacactttg cttttgcttg 484 

tgctgacggt actcgacata cctatcagct gcgtgcaaga tcagtttcac caaaactttt 544 

catcagacaa gaggaggttc aacaagagct ctactcgcca ctttttctca ttgttgctgc 604 

tctagtattt ttaatacttt gcttcaccat taagagaaag acagaatgaa tgagctcact 664 

ttaattgact tctatttgtg ctttttagcc tttctgctat tccttgtttt aataatgctt 724 

attatatttt ggttttcact cgaaatccag gatctagaag aaccttgtac caaagtctaa 784 

acgaacatga aacttctcat tgttttgact tgtatttctc tatgcagttg catatgcact 844 

gtagtacagc gctgtgcatc taataaacct catgtgcttg aagatccttg taaggtacaa 904 

cactaggggt aatacttata gcactgcttg gctttgtgct ctaggaaagg ttttaccttt 964 

tcatagatgg cacactatgg ttcaaacatg cacacctaat gttactatca actgtcaaga 1024 

tccagctggt ggtgcgctta tagctaggtg ttggtacctt catgaaggtc accaaactgc 1084 

tgcatttaga gacgtacttg ttgttttaaa taaacgaaca aattaaaatg tctgataatg 1144 

gaccccaatc aaaccaacgt agtgcccccc gcattacatt tggtggaccc acagattcaa 1204 

ctgacaataa ccagaatgga ggacgca 1231 

<210> 22 

<211> 63 

<212> PRT 

<213> CORONAVIRUS 



<400> 22 

Met Phe His Leu Val Asp Phe Gin val Thr He Ala Glu lie Leu lie 
1 5 10 15 

lie He Met Arg Thr Phe Arg He Ala He Trp Asn Leu Asp val lie 
20 25 30 

He ser ser lie val Arg Gin Leu Phe Lys Pro Leu Thr Lys Lys Asn 
35 " 40 45 

Tyr ser Glu Leu Asp Asp Glu Glu Pro Met Glu Leu Asp Tyr Pro 
50 55 60 



<210> 23 
<211> 1231 
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<212> DNA 

<213> CORONAVIRUS 

<220> 

<221> CDS 

<222> (285) . . (650) 

<223> 



<400> 23 

taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 60 

ttgctagtac agtaagtgac aacagatgtt tcatcttgtt gacttccagg ttacaatagc 120 

agagatattg attatcatta tgaggacttt caggattgct atttggaatc ttgacgttat 180 

aataagttca atagtgagac aattatttaa gcctctaact aagaagaatt attcggagtt 240 

agatgatgaa gaacctatgg agttagatta tccataaaac gaac atg aaa att att 296 

Met Lys lie lie 

etc ttc ctg aca ttg att gta ttt aca tct tgc gag eta tat cac tat 344 

Leu Phe Leu Thr Leu lie val Phe Thr ser Cys Glu Leu Tyr His Tyr 

5 10 15 20 

cag gag tgt gtt aga ggt acg act gta eta eta aaa gaa cct tgc cca 392 

Gin Glu cys Val Arg Gly Thr Thr val Leu Leu Lys Glu Pro Cys Pro 

25 30 35 

tea gga aca tac gag gqc aat tea cca ttt cac cct ctt get gac aat 440 

ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro Leu Ala Asp Asn 



488 



40 45 50 

aaa ttt gca eta act tgc act age aca cac ttt get ttt get tgt get 
Lys Phe Ala Leu Thr Cys Thr ser Thr His Phe Ala Phe Ala Cys Ala 
55 60 65 

gac ggt act cga cat ace tat cag ctg cgt gca aga tea gtt tea cca 536 
Asp Gly Thr Arg His Thr Tyr Gin Leu Arg Ala Arg ser Val Ser Pro 
70 75 80 

aaa ctt ttc ate aga caa gag gag gtt caa caa gag etc tac teg cca 584 
Lys Leu Phe lie Arg Gin Glu Glu Val Gin Gin Glu Leu Tyr Ser Pro 
85 90 95 100 

ctt ttt etc att gtt get get eta gta ttt tta ata ctt tgc ttc ace 632 
Leu Phe Leu lie val Ala Ala Leu Val Phe Leu lie Leu Cys Phe Thr 
105 110 115 

att aag aga aag aca gaa tgaatgagct cactttaatt gacttctatt 680 
lie Lys Arg Lys Thr Glu 
120 

tgtgcttttt agectttctg ctattccttg ttttaataat gcttattata ttttggtttt 740 

cactcgaaat ccaggatcta gaagaacctt gtaccaaagt ctaaacgaac atgaaacttc 800 

tcattgtttt gacttgtatt tetctatgea gttgcatatg cactgtagta cagcgctgtg 860 
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catctaataa 


acctcatgtg 


cttgaagatc 


cttgtaaggt 


acaacactag 


gggtaatact 


920 


tatagcactg 


cttggctttg 


tgctctagga aaggttttac 


cttttcatag 


atggcacact 


980 


atggttcaaa 


catgcacacc 


taatgttact 


atcaactgtc 


aagatccagc 


tggtggtgcg 


1040 


cttatagcta 


ggtgttggta 


ccttcatgaa 


ggtcaccaaa 


ctgctgcatt 


tagagacgta 


1100 


cttgttgttt 


taaataaacg 


aacaaattaa 


aatgtctgat 


aatggacccc 


aatcaaacca 


1160 


acgtagtgcc 


ccccgcatta 


catttggtgg 


acccacagat 


tcaactgaca 


ataaccagaa 


1220 


tggaggacgc 


a 










1231 



<210> 24 

<211> 122 

<212> PRT 

<213> CORONAVIRUS 



<400> 24 

Met Lys lie lie Leu Phe Leu Thr Leu lie val Phe Thr ser Cys Glu 
15 10 15 

Leu Tyr His Tyr Gin Glu Cys val Arg Gly Thr Thr Val Leu Leu Lys 
20 '25 30 

Glu pro cys Pro ser Gly Thr Tyr Glu Gly Asn ser Pro Phe His Pro 
35 40 45 

Leu Ala Asp Asn Lys Phe Ala Leu Thr Cys Thr Ser Thr His Phe Ala 
50 55 60 

Phe Ala cys Ala Asp Gly Thr Arg His Thr Tyr Gin Leu Arg Ala Arg 
65 70 " 75 80 

Ser val Ser Pro Lys Leu Phe lie Arg Gin Glu Glu Val Gin Gin Glu 
85 90 95 

Leu Tyr Ser Pro Leu Phe Leu He val Ala Ala Leu val Phe Leu lie 
100 105 110 

Leu Cys Phe Thr lie Lys Arg Lys Thr Glu 
115 120 

<210> 25 

<211> 1231 

<212> DNA 

<213> CORONAVIRUS 
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. <220> 
<221> CDS 
<222> (650) . . (781) 
<223> 



<400> 25 

taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct bO 

ttgctagtac agtaagtgac aacagatgtt tcatcttgtt gacttccagg ttacaatagc 120 

agagatattg attatcatta tgaggacttt caggattgct atttggaatc ttgacgttat 180 

aataagttca atagtgagac aattatttaa gcctctaact aagaagaatt attcggagtt 240 

agatgatgaa gaacctatgg agttagatta tccataaaac gaacatgaaa attattctct 300 

tcctgacatt gattgtattt acatcttgcg agctatatca ctatcaggag tgtgttagag 360 

gtacgactgt actactaaaa gaaccttgcc catcaggaac atacgagggc aattcaccat 420 

ttcaccctct tgctgacaat aaatttgcac taacttgcac tagcacacac tttgcttttg 480 

cttgtgctga cggtactcga catacctatc agctgcgtgc aagatcagtt tcaccaaaac 540 

ttttcatcag acaagaggag gttcaacaag agctctactc gccacttttt ctcattgttg 600 

ctgctctagt atttttaata ctttgcttca ccattaagag aaagacaga atg aat gag 658 

3 ~ Met Asn Glu 



1 



<210> 26 
<211> 44 



706 



754 



etc act tta att gac ttc tat ttg tgc ttt tta gec ttt ctg eta ttc 
Leu Thr Leu lie Asp Phe Tyr Leu Cys Phe Leu Ala Phe Leu Leu Phe 
5 10 15 

ctt gtt tta ata atg ctt att ata ttt tgg ttt tea etc gaa ate cag 
Leu val Leu lie Met Leu lie lie Phe Trp Phe Ser Leu Glu lie Gin 
20 25 30 35 

gat eta gaa gaa cct tgt acc aaa gtc taaacgaaca tgaaacttct 801 
Asp Leu Glu Glu Pro cys Thr Lys val 
40 

cattgttttg acttgtattt etctatgeag ttgcatatgc actgtagtac agcgctgtgc 861 

atctaataaa cctcatgtgc ttgaagatcc ttgtaaggta caacactagg ggtaatactt 921 

atagcactgc ttggctttgt gctctaggaa aggttttacc ttttcataga tggcacacta 981 

tggttcaaac atgcacacct aatgttacta tcaactgtca agatccagct ggtggtgcgc 1041 

ttatagctag gtgttggtac cttcatgaag gtcaccaaac tgctgcattt agagaegtae 1101 

ttgttgtttt aaataaacga acaaattaaa atgtctgata atggacccca atcaaaccaa 1161 

cgtagtgccc cccgcattac atttggtgga cccacagatt caactgacaa taaccagaat 1221 
ggaggacgea 



1231 
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<400> 26 

Met Asn Glu Leu Thr Leu lie Asp Phe Tyr Leu cys Phe Leu Ala Phe 
1 5 10 15 

Leu Leu Phe Leu Val Leu lie Met Leu He He Phe Trp Phe ser Leu 
20 25 30 

Glu lie Gin Asp Leu Glu Glu Pro Cys Thr Lys Val 
35 40 

<210> 27 

<211> 1231 

<212> DNA 

<213> CORONAVIRUS 

<220> 

<221> CDS 

<222> (791) . . C907) 

<223> 



<400> 27 
taccgtattg 


gaaactataa attaaataca 


gaccacgccg 


gtagcaacga 


caatattgct 


60 


ttgctagtac 


agtaagtgac aacagatgtt 


tcatcttgtt 


gacttccagg 


ttacaatagc 


120 


agagatattg 


attatcatta tgaggacttt 


caggattgct 


atttggaatc 


ttgacgttat 


180 


aataagttca 


atagtgagac 


aattatttaa 


gcctctaact 


aagaagaatt 


attcggagtt 


240 


agatgatgaa 


gaacctatgg 


agttagatta 


tccataaaac 


gaacatgaaa 


attattctct 


300 


tcctgacatt 


gattgtattt 


acatcttgcg 


agctatatca ctatcaggag 


tgtgttagag 


360 


gtacgactgt 


actactaaaa 


gaaccttgcc 


catcaggaac 


atacgagggc 


aattcaccat 


420 


ttcaccctct 


tgctgacaat 


aaatttgcac 


taacttgcac 


tagcacacac 


tttgcttttg 


480 


cttgtgctga 


cggtactcga 


catacctatc 


agctgcgtgc 


aagatcagtt 


tcaccaaaac 


540 


ttttcatcag 


acaagaggag 


gttcaacaag 


agctctactc 


gccacttttt 


ctcattgttg 


600 


ctgctctagt 


atttttaata 


ctttgcttca 


ccattaagag 


aaagacagaa 


tgaatgagct 


660 


cactttaatt 


gacttctatt 


tgtgcttttt 


agcctttctg 


ctattccttg 


ttttaataat 


720 


gcttattata 


ttttggtttt 


cactcgaaat 


ccaggatcta gaagaacctt 


gtaccaaagt 


780 
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ctaaacgaac atg aaa ctt etc att gtt ttg act tgt att tct eta tgc 
Met Lys Leu Leu lie val Leu Thr Cys lie ser Leu Cys 
15 10 

agt tgc ata tgc act gta gta cag cgc tgt gca tct aat aaa cct cat 
ser Cys lie Cys Thr val val Gin Arg cys Ala ser Asn Lys Pro His 
15 20 25 

gtg ctt gaa gat cct tgt aag gta caa cac taggggtaat acttatagca 
val Leu Glu Asp Pro Cys Lys val Gin His 



829 



877 



927 



30 




35 










ctgcttggct 


ttgtgctcta 


ggaaaggttt 


taccttttca 


tagatggcac 


actatggttc 


987 


aaacatgeae 


acctaatgtt 


actatcaact 


gtcaagatcc 


agctggtggt 


gegcttatag 


1047 


ctaggtgttg 


gtaccttcat 


gaaggtcacc 


aaactgctgc 


atttagagac 


gtacttgttg 


1107 


ttttaaataa 


acgaacaaat 


taaaatgtct 


gataatggac 


cccaatcaaa 


ecaaegtagt 


1167 


gccccccgca 


ttacatttgg 


tggacccaca 


gattcaactg 


acaataacca gaatggagga 


1227 


cgea 














1231 


<210> 


28 














<211> 


39 














<212> 


PRT 














<213> 


CORONAVIRUS 













<400> 28 

Met Lys Leu Leu He val Leu Thr cys lie ser Leu cys Ser Cys He 
15 10 15 

cys Thr val val Gin Arg Cys Ala Ser Asn Lys Pro His Val Leu Glu 
20 25 30 

Asp Pro cys Lys val Gin His 
35 

<210> 29 

<211> 1231 

<212> DNA 

<213> CORONAVIRUS 



<220> 

<221> CDS 

<222> (876) . . C1127) 

<223> 
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<400> 29 
taccgtattg 


gaaactataa 


attaaataca 


gaccacgccg 


gtagcaacga 


caatattgct 


60 


ttgctagtac 


agtaagtgac 


aacagatgtt 


tcatcttgtt 


gacttccagg 


ttacaatagc 


120 


agagatattg 


attatcatta 


tgaggacttt 


caggattgct 


atttggaatc 


ttgacgttat 


180 


aataagttca 


atagtgagac 


aattatttaa 


gcctctaact 


aagaagaatt 


attcggagtt 


240 


agatgatgaa 


gaacctatgg 


agttagatta 


tccataaaac 


gaacatgaaa 


attattctct 


300 


tcctgacatt 


gattgtattt 


acatcttgcg 


agctatatca 


ctatcaggag 


tgtgttagag 


360 


gtacgactgt 


actactaaaa 


gaaccttgcc 


catcaggaac 


atacgagggc 


aattcaccat 


420 


ttcaccctct 


tgctgacaat 


aaatttgcac 


taacttgcac 


tagcacacac 


tttgcttttg 


480 


cttgtgctga 


cggtactcga 


catacctatc 


agctgcgtgc 


aagatcagtt 


tcaccaaaac 


540 


ttttcatcag 


acaagaggag 


gttcaacaag 


agctctactc 


gccacttttt 


ctcattgttg 


600 


ctgctctagt 


atttttaata 


ctttgcttca 


ccattaagag 


aaagacagaa 


tgaatgagct 


660 


cactttaatt 


gacttctatt 


tgtgcttttt 


agcctttctg 


ctattccttg 


ttttaataat 


720 


gcttattata 


ttttggtttt 


cactcgaaat 


ccaggatcta 


gaagaacctt 


gtaccaaagt 


780 


ctaaacgaac 


atgaaacttc 


tcattgtttt 


gacttgtatt 


tctctatgca 


gttgcatatg 


840 


cactgtagta 


cagcgctgtg 


catctaataa 


acctc atg tgc ttg aag 
Met cys Leu Lys 


ate ctt 
lie Leu 
5 


893 



gta agg tac aac act agg ggt aat act tat age act get tgg ctt tgt 941 
val Arg Tyr Asn Thr Arg Gly Asn Thr Tyr ser Thr Ala Trp Leu Cys 
10 15 20 

get eta gga aag gtt tta cct ttt cat aga tgg cac act atg gtt caa 989 
Ala Leu Gly Lys val Leu Pro Phe His Arg Trp His Thr Met Val Gin 
25 30 35 

aca tgc aca cct aat gtt act ate aac tgt caa gat cca get ggt ggt 1037 
Thr Cys Thr Pro Asn val Thr He Asn Cys Gin Asp Pro Ala Gly Gly 
40 45 50 

gcg ctt ata get agg tgt tgg tac ctt cat gaa ggt cac caa act get 1085 
Ala Leu He Ala Arg cys Trp Tyr Leu His Glu Gly His Gin Thr Ala 
55 60 65 70 

gca ttt aga gac gta ctt gtt gtt tta aat aaa cga aca aat 1127 
Ala Phe Arg Asp val Leu Val val Leu Asn Lys Arg Thr Asn 
75 80 

taaaatgtct gataatggac cccaatcaaa ecaaegtagt gccccccgca ttacatttgg 1187 

tggacccaca gattcaactg acaataacca gaatggagga cgea 1231 

<210> 30 

<211> 84 

<212> PRT 

<213> CORONAVIRUS 
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<400> 30 

Met cys Leu Lys lie Leu val Arg Tyr Asn Thr Arg Gly Asn Thr Tyr 
15 10 15 

ser Thr Ala Trp Leu Cys Ala Leu Gly Lys Val Leu Pro Phe His Arg 
20 25 30 

Trp His Thr Met val Gin Thr cys Thr Pro Asn Val Thr lie Asn cys 
35 40 45 

Gin Asp Pro Ala Gly Gly Ala Leu lie Ala Arg Cys Trp Tyr Leu His 
50 55 60 

Glu Gly His Gin Thr Ala Ala Phe Arg Asp val Leu val val Leu Asn 
65 70 75 80 

Lys Arg Thr Asn 



<210> 31 

<211> 21221 

<212> DNA 

<213> CORONAVIRUS 

<400> 31 

atggagagcc ttgttcttgg tgtcaacgag aaaacacacg tccaactcag tttgcctgtc bo 

cttcaggtta gagacgtgct agtgcgtggc ttcggggact ctgtggaaga ggccctatcg 120 

gaggcacgtg aacacctcaa aaatggcact tgtggtctag tagagctgga aaaaggcgta 180 

ctgccccagc ttgaacagcc ctatgtgttc attaaacgtt ctgatgcctt aagcaccaat 240 

cacggccaca aggtcgttga gctggttgca gaaatggacg gcattcagta cggtcgtagc 300 

ggtataacac tgggagtact cgtgccacat gtgggcgaaa ccccaattgc ataccgcaat 360 

gttcttcttc gtaagaacgg taataaggga gccggtggtc atagctatgg catcgatcta 420 

aagtcttatg acttaggtga cgagcttggc actgatccca ttgaagatta tgaacaaaac 480 

tggaacacta agcatggcag tggtgcactc cgtgaactca ctcgtgagct caatggaggt 540 

gcagtcactc gctatgtcga caacaatttc tgtggcccag atgggtaccc tcttgattgc 600 

atcaaagatt ttctcgcacg cgcgggcaag tcaatgtgca ctctttccga acaacttgat 660 

tacatcgagt cgaagagagg tgtctactgc tgccgtgacc atgagcatga aattgcctgg 720 
ttcactgagc gctctgataa gagctacgag caccagacac ccttcgaaat taagagtgcc 
aagaaatttg acactttcaa aggggaatgc ccaaagtttg tgtttcctct taactcaaaa 

gtcaaagtca ttcaaccacg tgttgaaaag aaaaagactg agggtttcat ggggcgtata 900 
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cgctctgtgt 


accctgttgc 


atctccacag 


S226CAS111. 
gagtgtaaca 


ST25 

atatgcactt 


gtctaccttg 


960 


atgaaatgta 


atcattgcga 


tgaagtttca 


tggcagacgt 


gcgactttct 


gaaagccact 


1020 


tgtgaacatt 


gtggcactga 


aaatttagtt 


attgaaggac 


ctactacatg 


tgggtaccta 


1080 


cctactaatg 


ctgtagtgaa 


aatgccatgt 


cctgcctgtc 


aagacccaga 


gattggacct 


1140 


gagcatagtg 


ttgcagatta 


tcacaaccac 


tcaaacattg 


aaactcgact 


ccgcaaggga 


1200 


ggtaggacta 


gatgttttgg 


aggctgtgtg 


tttgcctatg 


ttggctgcta 


taataagcgt 


1260 


gcctactggg 


ttcctcgtgc 


tagtgctgat 


attggctcag 


gccatactgg 


cattactggt 


1320 


gacaatgtgg 


agaccttgaa 


tgaggatctc 


cttgagatac 


tgagtcgtga 


acgtgttaac 


1380 


attaacattg 


ttggcgattt 


tcatttgaat 


gaagaggttg 


ccatcatttt 


ggcatctttc 


1440 


tctgcttcta 


caaytgcctt 


tattgacact 


ataaagagtc 


ttgattacaa 


gtctttcaaa 


1500 


accattgttg 


agtcctgcgg 


taactataaa 


gttaccaagg 


gaaagcccgt 


aaaaggtgct 


1560 


tggaacattg 


gacaacagag 


atcagtttta 


acaccactgt 


gtggttttcc 


ctcacaggct 


1620 


gctggtgtta 


tcagatcaat 


ttttgcgcgc 


acacttgatg 


cagcaaacca 


ctcaattcct 


1680 


gatttgcaaa 


gagcagctgt 


caccatactt 


gatggtattt 


ctgaacagtc 


attacgtctt 


1740 


gtcgacgcca 


tggtttatac 


ttcagacctg 


ctcaccaaca 


gtgtcattat 


tatggcatat 


1800 


gtaactggtg 


gtcttgtaca 


acagacttct 


cagtggttgt 


ctaatctttt 


gggcactact 


1860 


gttgaaaaac 


tcaggcctat 


ctttgaatgg 


attgaggcga 


aacttagtgc 


aggagttgaa 


1920 


tttctcaagg 


atgcttggga 


gattctcaaa 


tttctcatta 


caggtgtttt 


tgacatcgtc 


1980 


aagggtcaaa 


tacaggttgc 


ttcagataac 


atcaaggatt 


gtgtaaaatg 


cttcattgat 


2040 


gttgttaaca 


aggcactcga 


aatgtgcatt 


gatcaagtca 


ctatcgctgg 


cgcaaagttg 


2100 


cgatcactca 


acttaggtga 


agtcttcatc 


gctcaaagca 


agggacttta 


ccgtcagtgt 


2160 


atacgtggca 


aggagcagct 


gcaactactc 


atgcctctta 


aggcaccaaa 


agaagtaacc 


2220 


tttcttgaag 


gtgattcaca 


tgacacagta 


cttacctctg 


aggaggttgt 


tctcaagaac 


2280 


ggtgaactcg 


aagcactcga 


gacgcccgtt 


gatagcttca 


caaatggagc 


tatcgttggc 


2340 


acaccagtct 


gtgtaaatgg 


cctcatgctc 


ttagagatta 


aggacaaaga 


acaatactgc 


2400 


gcattgtctc 


ctggtttact 


ggctacaaac 


aatgtctttc 


gcttaaaagg 


gggtgcacca 


2460 


attaaaggtg 


taacctttgg 


agaagatact 


gtttgggaag 


ttcaaggtta 


caagaatgtg 


2520 


agaatcacat 


ttgagcttga 


tgaacgtgtt 


gacaaagtgc 


ttaatgaaaa 


gtgctctgtc 


2580 


tacactgttg 


aatccggtac 


cgaagttact 


gagtttgcat 


gtgttgtagc 


agaggctgtt 


2640 


gtgaagactt 


tacaaccagt 


ttctgatctc 


cttaccaaca 


tgggtattga 


tcttgatgag 


2700 


tggagtgtag 


ctacattcta 


cttatttgat 


gatgctggtg 


aagaaaactt 


ttcatcacgt 


2760 


atgtattgtt 


ccttttaccc 


tccagatgag 


gaagaagagg 


acgatgcaga 


gtgtgaggaa 


2820 


gaagaaattg 


atgaaacctg 


tgaacatgag 


tacggtacag 


aggatgatta 


tcaaggtctc 


2880 


cctctggaat 


ttggtgcctc 


agctgaaaca 


gttcgagttg 


aggaagaaga 


agaggaagac 


2940 
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tggctggatg 


atactactga 


gcaatcagag 


S226CAS111. 
attgagccag 


5T25 

aaccagaacc 


tacacctgaa 


3000 


gaaccagtta 


atcagtttac 


tggttattta 


aaacttactg 


acaatgttgc 


cattaaatgt 


3060 


gttgacatcg 


ttaaggaggc 


acaaagtgct 


aatcctatgg 


tgattgtaaa 


tgctgctaac 


3120 


atacacctga 


aacatggtgg 


tggtgtagca 


ggtgcactca 


acaaggcaac 


caatggtgcc 


3180 


atgcaaaagg 


agagtgatga 


ttacattaag 


ctaaatggcc 


ctcttacagt 


aggagggtct 


3240 


tgtttgcttt 


ctggacataa 


tcttgctaag 


aagtgtctgc 


atgttgttgg 


acctaaccta 


3300 


aatgcaggtg 


aggacatcca 


gcttcttaag 


gcagcatatg 


aaaatttcaa 


ttcacaggac 


3360 


atcttacttg 


caccattgtt 


gtcagcaggc 


atatttggtg 


ctaaaccact 


tcagtcttta 


3420 


caagtgtgcg 


tgcagacggt 


tcgtacacag 


gtttatattg 


cagtcaatga 


caaagctctt 


3480 


tatgagcagg 


ttgtcatgga 


ttatcttgat 


aacctgaagc 


ctagagtgga 


agcacctaaa 


3540 


caagaggagc 


caccaaacac 


agaagattcc 


aaaactgagg 


agaaatctgt 


cgtacagaag 


3600 


cctgtcgatg 


tgaagccaaa 


aattaaggcc 


tgcattgatg 


aggttaccac 


aacactggaa 


3660 


gaaactaagt 


ttcttaccaa 


taagttactc 


ttgtttgctg 


atatcaatgg 


taagctttac 


3720 


catgattctc 


agaacatgct 


tagaggtgaa 


gatatgtctt 


tccttgagaa 


ggatgcacct 


3780 


tacatggtag 


gtgatgttat 


cactagtggt 


gatatcactt 


gtgttgtaat 


accctccaaa 


3840 


aaggctggtg 


gcactactga 


gatgctctca 


agagctttga agaaagtgcc 


agttgatgag 


3900 


tatataacca 


cgtaccctgg 


acaaggatgt 


gctggttata 


cacttgagga 


agctaagact 


3960 


gctcttaaga 


aatgcaaatc 


tgcattttat 


gtactacctt 


cagaagcacc 


taatgctaag 


4020 


gaagagattc 


taggaactgt 


atcctggaat 


ttgagagaaa 


tgcttgctca 


tgctgaagag 


4080 


acaagaaaat 


taatgcctat 


atgcatggat 


gttagagcca taatggcaac 


catccaacgt 


4140 


aagtataaag 


gaattaaaat 


tcaagagggc 


atcgttgact 


atggtgtccg 


attcttcttt 


4200 


tatactagta 


aagagcctgt 


agcttctatt 


attacgaagc tgaactctct 


aaatgagccg 


4260 


cttgtcacaa 


tgccaattgg 


ttatgtgaca 


catggtttta atcttgaaga 


ggctgcgcgc 


4320 


tgtatgcgtt 


ctcttaaagc 


tcctgccgta 


gtgtcagtat 


catcaccaga 


tgctgttact 


4380 


acatataatg 


gatacctcac 


ttcgtcatca 


aagacatctg 


aggagcactt 


tgtagaaaca 


4440 


gtttctttgg 


ctggctctta 


cagagattgg 


tcctattcag 


gacagcgtac 


agagttaggt 


4500 


gttgaatttc 


ttaagcgtgg 


tgacaaaatt 


gtgtaccaca 


ctctggagag 


ccccgtcgag 


4560 


tttcatcttg 


acggtgaggt 


tctttcactt 


gacaaactaa 


agagtctctt 


atccctgcgg 


4620 


gaggttaaga 


ctataaaagt 


gttcacaact 


gtggacaaca 


ctaatctcca 


cacacagctt 


4680 


gtggatatgt 


ctatgacata 


tggacagcag 


tttggtccaa 


catacttgga 


tggtgctgat 


4740 


gttacaaaaa 


ttaaacctca 


tgtaaatcat 


gagggtaaga 


ctttctttgt 


actacctagt 


4800 


gatgacacac 


tacgtagtga 


agctttcgag 


tactaccata 


ctcttgatga 


gagttttctt 


4860 


ggtaggtaca 


tgtctgcttt 


aaaccacaca 


aagaaatgga 


aatttcctca 


agttggtggt 


4920 


ttaacttcaa 


ttaaatgggc 


tgataacaat 


tgttatttgt 


ctagtgtttt 


attagcactt 


4980 
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caacagcttg aagtcaaatt 


caatgcacca 


S226CASU1. 
gcacttcaag 


ST25 

aggcttatta 


tagagcccgt 


5040 


gctggtgatg ctgctaactt 


ttgtgcactc 


atactcgctt 


acagtaataa 


aactgttggc 


5100 


gagcttggtg atgtcagaga 


aactatgacc 


catcttctac 


agcatgctaa 


tttggaatct 


5160 


gcaaagcgag ttcttaatgt 


ggtgtgtaaa 


cattgtggtc 


agaaaactac 


taccttaacg 


5220 


ggtgtagaag ctgtgatgta 


tatgggtact 


ctatcttatg 


ataatcttaa 


gacaggtgtt 


5280 


tccattccat gtgtgtgtgg 


tcgtgatgct 


acacaatatc 


tagtacaaca 


agagtcttct 


5340 


tttgttatga tgtctgcacc 


acctgctgag 


tataaattac 


agcaaggtac 


attcttatgt 


5400 


gcgaatgagt acactggtaa 


ctatcagtgt 


ggtcattaca 


ctcatataac 


tgctaaggag 


5460 


accctctatc gtattgacgg 


agctcacctt 


acaaagatgt 


cagagtacaa 


aggaccagtg 


5520 


actgatgttt tctacaagga 


aacatcttac 


actacaacca 


tcaagcctgt 


gtcgtataaa 


5580 


ctcgatggag ttacttacac 


agagattgaa 


ccaaaattgg 


atgggtatta 


taaaaaggat 


5640 


aatgcttact atacagagca 


gcctatagac 


cttgtaccaa 


ctcaaccatt 


accaaatgcg 


5700 


agttttgata atttcaaact 


cacatgttct 


aacacaaaat 


ttgctgatga 


tttaaatcaa 


5760 


atgacaggct tcacaaagcc 


agcttcacga 


gagctatctg 


tcacattctt 


cccagacttg 


5820 


aatggcgatg tagtggctat 


tgactataga 


cactattcag 


cgagtttcaa 


gaaaggtgct 


5880 


aaattactgc ataagccaat 


tgtttggcac 


attaaccagg 


ctacaaccaa 


gacaacgttc 


5940 


aaaccaaaca cttggtgttt 


acgttgtctt 


tggagtacaa 


agccagtaga 


tacttcaaat 


6000 


tcatttgaag ttctggcagt 


agaagacaca 


caaggaatgg 


acaatcttgc 


ttgtgaaagt 


6060 


caacaaccca cctctgaaga 


agtagtggaa 


aatcctacca 


tacagaagga 


agtcatagag 


6120 


tgtgacgtga aaactaccga 


agttgtaggc 


aatgtcatac 


ttaaaccatc 


agatgaaggt 


6180 


gttaaagtaa cacaagagtt 


aggtcatgag 


gatcttatgg 


ctgcttatgt 


ggaaaacaca 


6240 


agcattacca ttaagaaacc 


taatgagctt 


tcactagcct 


taggtttaaa 


aacaattgcc 


6300 


actcatggta ttgctgcaat 


taatagtgtt 


ccttggagta 


aaattttggc 


ttatgtcaaa 


6360 


ccattcttag gacaagcagc 


aattacaaca 


tcaaattgcg 


ctaagagatt 


agcacaacgt 


6420 


gtgtttaaca attatatgcc 


ttatgtgttt 


acattattgt 


tccaattgtg 


tacttttact 


6480 


aaaagtacca attctagaat 


tagagcttca 


ctacctacaa 


ctattgctaa 


aaatagtgtt 


6540 


aagagtgttg ctaaattatg 


tttggatgcc 


ggcattaatt 


atgtgaagtc 


acccaaattt 


6600 


tctaaattgt tcacaatcgc 


tatgtggcta 


ttgttgttaa 


gtatttgctt 


aggttctcta 


6660 


atctgtgtaa ctgctgcttt 


tggtgtactc 


ttatctaatt 


ttggtgctcc 


ttcttattgt 


6720 


aatggcgtta gagaattgta 


tcttaattcg 


tctaacgtta 


ctactatgga 


tttctgtgaa 


6780 


ggttcttttc cttgcagcat 


ttgtttaagt 


ggattagact 


cccttgattc 


ttatccagct 


6840 


cttgaaacca ttcaggtgac 


gatttcatcg 


tacaagctag 


acttgacaat 


tttaggtctg 


6900 


gccgctgagt gggttttggc 


atatatgttg 


ttcacaaaat 


tcttttattt 


attaggtctt 


6960 


tcagctataa tgcaggtgtt 


ctttggctat 


tttgctagtc 


atttcatcag 


caattcttgg 


7020 
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ctcatgtggt 


ttatcattag 


tattgtacaa 


S226CAS111. 
atggcacccg 


ST25 

tttctgcaat 


ggttaggatg 


7080 


tacatcttct 


ttgcttcttt 


ctactacata 


tggaagagct 


atgttcatat 


catggatggt 


7140 


tgcacctctt 


cgacttgcat 


gatgtgctat 


aagcgcaatc 


gtgccacacg 


cgttgagtgt 


7200 


acaactattg 


ttaatggcat 


gaagagatct 


ttctatgtct 


atgcaaatgg 


aggccgtggc 


7260 


ttctgcaaga 


ctcacaattg 


gaattgtctc 


aattgtgaca 


cattttgcac 


tggtagtaca 


7320 


ttcattagtg 


atgaagttgc 


tcgtgatttg 


tcactccagt 


ttaaaagacc 


aatcaaccct 


7380 


actgaccagt 


catcgtatat 


tgttgatagt 


gttgctgtga 


aaaatggcgc 


gcttcacctc 


7440 


tactttgaca 


aggctggtca 


aaagacctat 


gagagacatc 


cgctctccca 


ttttgtcaat 


7500 


ttagacaatt 


tgagagctaa 


caacactaaa 


ggttcactgc 


ctattaatgt 


catagttttt 


7560 


gatggcaagt 


ccaaatgcga 


cgagtctgct 


tctaagtctg 


cttctgtgta 


ctacagtcag 


7620 


ctgatgtgcc 


aacctattct 


gttgcttgac 


caagctcttg 


tatcagacgt 


tggagatagt 


7680 


actgaagttt 


ccgttaagat 


gtttgatgct 


tatgtcgaca 


ccttttcagc 


aacttttagt 


7740 


gttcctatgg 


aaaaacttaa 


ggcacttgtt 


gctacagctc 


acagcgagtt 


agcaaagggt 


7800 


gtagctttag 


atggtgtcct 


ttctacattc 


gtgtcagctg 


cccgacaagg 


tgttgttgat 


7860 


accgatgttg 


acacaaagga 


tgttattgaa 


tgtctcaaac 


tttcacatca 


ctctgactta 


7920 


gaagtgacag 


gtgacagttg 


taacaatttc 


atgctcacct 


ataataaggt 


tgaaaacatg 


7980 


acgcccagag 


atcttggcgc 


atgtattgac 


tgtaatgcaa 


ggcatatcaa 


tgcccaagta 


8040 


gcaaaaagtc 


acaatgtttc 


actcatctgg 


aatgtaaaag 


actacatgtc 


tttatctgaa 


8100 


cagctgcgta 


aacaaattcg 


tagtgctgcc 


aagaagaaca 


acataccttt 


tagactaact 


8160 


tgtgctacaa 


ctagacaggt 


tgtcaatgtc 


ataactacta 


aaatctcact 


caagggtggt 


8220 


aagattgtta 


gtacttgttt 


taaacttatg 


cttaaggcca 


cattattgtg 


cgttcttgct 


8280 


gcattggttt 


gttatatcgt 


tatgccagta 


catacattgt 


caatccatga 


tggttacaca 


8340 


aatgaaatca 


ttggttacaa 


agccattcag 


gatggtgtca 


ctcgtgacat 


catttctact 


8400 


gatgattgtt 


ttgcaaataa 


acatgctggt 


tttgacgcat 


ggtttagcca 


gcgtggtggt 


8460 


tcatacaaaa 


atgacaaaag 


ctgccctgta 


gtagctgcta 


tcattacaag 


agagattggt 


8520 


ttcatagtgc 


ctggcttacc 


gggtactgtg 


ctgagagcaa 


tcaatggtga 


cttcttgcat 


8580 


tttctacctc 


gtgtttttag 


tgctgttggc 


aacatttgct 


acacaccttc 


caaactcatt 


8640 


gagtatagtg 


attttgctac 


ctctgcttgc 


gttcttgctg 


ctgagtgtac 


aatttttaag 


8700 


gatgctatgg 


gcaaacctgt 


gccatattgt 


tatgacacta 


atttgctaga 


gggttctatt 


8760 


tcttatagtg 


agcttcgtcc 


agacactcgt 


tatgtgctta 


tggatggttc 


catcatacag 


8820 


tttcctaaca 


cttacctgga 


gggttctgtt 


agagtagtaa 


caacttttga 


tgctgagtac 


8880 


tgtagacatg 


gtacatgcga 


aaggtcagaa 


gtaggtattt 


gcctatctac 


cagtggtaga 


8940 


tgggttctta 


ataatgagca 


ttacagagct 


ctatcaggag 


ttttctgtgg 


tgttgatgcg 


9000 


atgaatctca 


tagctaacat 


ctttactcct 


cttgtgcaac 


ctgtgggtgc 


tttagatgtg 


9060 
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tctgcttcag tagtggctgg tggtattatt gccatattgg tgacttgtgc tgcctactac 9120 

tttatgaaat tcagacgtgt ttttggtgag tacaaccatg ttgttgctgc taatgcactt 9180 

ttgtttttga tgtctttcac tatactctgt ctggtaccag cttacagctt tctgccggga 9240 

gtctactcag tcttttactt gtacttgaca ttctatttca ccaatgatgt ttcattcttg 9300 

gctcaccttc aatggtttgc catgttttct cctattgtgc ctttttggat aacagcaatc 9360 

tatgtattct gtatttctct gaagcactgc cattggttct ttaacaacta tcttaggaaa 9420 

agagtcatgt ttaatggagt tacatttagt accttcgagg aggctgcttt gtgtaccttt 9480 

ttgctcaaca aggaaatgta cctaaaattg cgtagcgaga cactgttgcc acttacacag 9540 

tataacaggt atcttgctct atataacaag tacaagtatt tcagtggagc cttagatact 9600 

accagctatc gtgaagcagc ttgctgccac ttagcaaagg ctctaaatga ctttagcaac 9660 

tcaggtgctg atgttctcta ccaaccacca cagacatcaa tcacttctgc tgttctgcag 9720 

agtggtttta ggaaaatggc attcccgtca ggcaaagttg aagggtgcat ggtacaagta 9780 

acctgtggaa ctacaactct taatggattg tggttggatg acacagtata ctgtccaaga 9840 

catgtcattt gcacagcaga agacatgctt aatcctaact atgaagatct gctcattcgc 9900 

aaatccaacc atagctttct tgttcaggct ggcaatgttc aacttcgtgt tattggccat 9960 

tctatgcaaa attgtctgct taggcttaaa gttgatactt ctaaccctaa gacacccaag 10020 

tataaatttg tccgtatcca acctggtcaa acattttcag ttctagcatg ctacaatggt 10080 

tcaccatctg gtgtttatca gtgtgccatg agacctaatc ataccattaa aggttctttc 10140 

cttaatggat catgtggtag tgttggtttt aacattgatt atgattgcgt gtctttctgc 10200 

tatatgcatc atatggagct tccaacagga gtacacgctg gtactgactt agaaggtaaa 10260 

ttctatggtc catttgttga cagacaaact gcacaggctg caggtacaga cacaaccata 10320 

acattaaatg ttttggcatg gctgtatgct gctgttatca atggtgatag gtggtttctt 10380 

aatagattca ccactacttt gaatgacttt aaccttgtgg caatgaagta caactatgaa 10440 

cctttgacac aagatcatgt tgacatattg ggacctcttt ctgctcaaac aggaattgcc 10500 

gtcttagata tgtgtgctgc tttgaaagag ctgctgcaga atggtatgaa tggtcgtact 10560 

atccttggta gcactatttt agaagatgag tttacaccat ttgatgttgt tagacaatgc 10620 

tctggtgtta ccttccaagg taagttcaag aaaattgtta agggcactca tcattggatg 10680 

cttttaactt tcttgacatc actattgatt cttgttcaaa gtacacagtg gtcactgttt 10740 

ttctttgttt acgagaatgc tttcttgcca tttactcttg gtattatggc aattgctgca 10800 

tgtgctatgc tgcttgttaa gcataagcac gcattcttgt gcttgtttct gttaccttct 10860 

cttgcaacag ttgcttactt taatatggtc tacatgcctg ctagctgggt gatgcgtatc 10920 

atgacatggc ttgaattggc tgacactagc ttgtctggtt ataggcttaa ggattgtgtt 10980 

atgtatgctt cagctttagt tttgcttatt ctcatgacag ctcgcactgt ttatgatgat 11040 

gctgctagac gtgtttggac actgatgaat gtcattacac ttgtttacaa agtctactat 11100 
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ggtaatgctt tagatcaagc tatttccatg 
tattctggtg tcgttacgac tatcatgttt 
gagtattacc cattgttatt tattactggc 
tgtttcttag gctattgttg ctgctgctac 
ttcaggctta ctcttggtgt ttatgactac 
aactcccagg ggcttttgcc tcctaagagt 
ttgttgggta ttggaggtaa accatgtatc 
gacgtaaagt gcacatctgt ggtactgctc 
tcttctaaat tgtgggcaca atgtgtacaa 
acaactgaag ctttcgagaa gatggtttct 
gctgtagaca ttaataggtt gtgcgaggaa 
attgcttxag aatttagttc tttaccatca 
tatgagcagg ctgtagctaa tggtgattct 
ttgaatgtgg ctaaatctga gtttgaccgt 
atggcagatc aggctatgac ccaaatgtac 
aaagtaacta gtgctatgca aacaatgctc 
gcacttaaca acattatcaa caatgcgcgt 
ttgactacag cagccaaact catggttgtt 
tgtgatggta acacctttac atatgcatct 
gcggatagca agattgttca acttagtgaa 
tggcctctta ttgttacagc tctaagagcc 
ctgagtccag tagcactacg acagatgtcc 
actgatrgaca atgcacttgc ctactataac 
ttactatcag accaccaaga tctcaaatgg 
acaatttaca cagaactgga accaccttgt 
aaagtgaaat acttgtactt catcaaaggc 
ggcagtrttag ctgctacagt acgtcttcag 
tcaactgtgc tttccttctg tgcttttgca 
ctagcaagtg gaggacaacc aatcaccaac 
acaggacagg caattactgt aacaccagaa 
gcttcatgtt gtctgtattg tagatgccac 
gacttgaaag gtaagtacgt ccaaatacct 
acacttagaa acacagtctg taccgtctgc 
gaccaactcc gcgaaccctt gatgcagtct 



S226CAS111. 
tgggccttag 


ST25 

ttatttctgt 


aacctctaac 


11160 


ttagctagag 


ctatagtgtt 


tgtgtgtgtt 


11220 


aacaccttac 


agtgtatcat 


gcttgtttat 


11280 


tttggccttt 


tctgtttact 


caaccgttac 


11340 


ttggtctcta 


cacaagaatt 


taggtatatg 


11400 


agtattgatg 


ctttcaagct 


taacattaag 


11460 


aaggttgcta 


ctgtacagtc 


taaaatgtct 


11520 


tcggttcttc 


aacaacttag 


agtagagtca 


11580 


ctccacaatg 


atattcttct 


tgcaaaagac 


11640 


cttttgtctg 


ttttgctatc 


catgcagggt 


11700 


atgctcgata 


accgtgctac 


tcttcaggct 


11760 


tatgccgctt 


atgccactgc 


ccaggaggcc 


11820 


gaagtcgttc 


tcaaaaagtt 


aaagaaatct 


11880 


gatgctgcca 


tgcaacgcaa 


gttggaaaag 


11940 


aaacaggcaa 


gatctgagga 


caagagggca 


12000 


ttcactatgc 


ttaggaagct 


tgataatgat 


12060 


gatggttgtg 


ttccactcaa 


catcatacca 


12120 


gtccctgatt 


atggtaccta 


caagaacact 


12180 


gcactctggg 


aaatccagca 


agttgttgat 


12240 


attaacatgg 


acaattcacc 


aaatttggct 


12300 


aactcagctg 


ttaaactaca 


gaataatgaa 


12360 


tgtgcggctg 


gtaccacaca 


aacagcttgt 


12420 


aattcgaagg 


gaggtaggtt 


tgtgctggca 


12480 


gctagattcc 


ctaagagtga 


tggtacaggt 


12540 


aggtttgtta 


cagacacacc 


aaaagggcct 


12600 


ttaaacaacc 


taaatagagg 


tatggtgctg 


12660 


gctggaaatg 


ctacagaagt 


acctgccaat 


12720 


gtagaccctg 


ctaaagcata 


taaggattac 


12780 


tgtgtgaaga 


tgttgtgtac 


acacactggt 


12840 


gctaacatgg 


accaagagtc 


ctttggtggt 


12900 


attgaccatc 


caaatcctaa 


aggattctgt 


12960 


accacttgtg 


ctaatgaccc 


agtgggtttt 


13020 


ggaatgtgga 


aaggttatgg 


ctgtagttgt 


13080 


gcggatgcat 


caacgttttt 


aaacgggttt 


13140 
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gcggtgtaag tgcagcccgt cttacaccgt gcggcacagg cactagtact gatgtcgtct 13200 

acagggcttt tgatatttac aacgaaaaag ttgctggttt tgcaaagttc ctaaaaacta 13260 

attgctgtcg cttccaggag aaggatgagg aaggcaattt attagactct tactttgtag 13320 

ttaagaggca tactatgtct aactaccaac atgaagagac tatttataac ttggttaaag 13380 

attgtccagc ggttgctgtc catgactttt tcaagtttag agtagatggt gacatggtac 13440 

cacatatatc acgtcagcgt ctaactaaat acacaatggc tgatttagtc tatgctctac 13500 

gtcattttga tgagggtaat tgtgatacat taaaagaaat actcgtcaca tacaattgct 13560 

gtgatgatga ttatttcaat aagaaggatt ggtatgactt cgtagagaat cctgacatct 13620 

tacgcgtata tgctaactta ggtgagcgtg tacgccaatc attattaaag actgtacaat 13680 

tctgcgatgc tatgcgtgat gcaggcattg taggcgtact gacattagat aatcaggatc 13740 

ttaatgggaa ctggtacgat ttcggtgatt tcgtacaagt agcaccaggc tgcggagttc 13800 

ctattgtgga ttcatattac tcattgctga tgcccatcct cactttgact agggcattgg 13860 

ctgctgagtc ccatatggat gctgatctcg caaaaccact tattaagtgg gatttgctga 13920 

aatatgattt tacggaagag agactttgtc tcttcgaccg ttattttaaa tattgggacc 13980 

agacatacca tcccaattgt attaactgtt tggatgatag gtgtatcctt cattgtgcaa 14040 

actttaatgt gttattttct actgtgtttc cacctacaag ttttggacca ctagtaagaa 14100 

aaatatttgt agatggtgtt ccttttgttg tttcaactgg ataccatttt cgtgagttag 14160 

gagtcgtaca taatcaggat gtaaacttac atagctcgcg tctcagtttc aaggaacttt 14220 

tagtgtatgc tgctgatcca gctatgcatg cagcttctgg caatttattg ctagataaac 14280 

gcactacatg cttttcagta gctgcactaa caaacaatgt tgcttttcaa actgtcaaac 14340 

ccggtaattt taataaagac ttttatgact ttgctgtgtc taaaggtttc tttaaggaag 14400 

gaagttctgt tgaactaaaa cacttcttct ttgctcagga tggcaacgct gctatcagtg 14460 

attatgacta ttatcgttat aatctgccaa caatgtgtga tatcagacaa ctcctattcg 14520 

tagttgaagt tgttgataaa tactttgatt gttacgatgg tggctgtatt aatgccaacc 14580 

aagtaatcgt taacaatctg gataaatcag ctggtttccc atttaataaa tggggtaagg 14640 

ctagacttta ttatgactca atgagttatg aggatcaaga tgcacttttc gcgtatacta 14700 

agcgtaatgt catccctact ataactcaaa tgaatcttaa gtatgccatt agtgcaaaga 14760 

atagagctcg caccgtagct ggtgtctcta tctgtagtac tatgacaaat agacagtttc 14820 

atcagaaatt attgaagtca atagccgcca ctagaggagc tactgtggta attggaacaa 14880 

gcaagtttta cggtggctgg cataatatgt taaaaactgt ttacagtgat gtagaaactc 14940 

cacaccttat gggttgggat tatccaaaat gtgacagagc catgcctaac atgcttagga 15000 

taatggcctc tcttgttctt gctcgcaaac ataacacttg ctgtaactta tcacaccgtt 15060 

tctacaggtt agctaacgag tgtgcgcaag tattaagtga gatggtcatg tgtggcggct 15120 

cactatatgt taaaccaggt ggaacatcat ccggtgatgc tacaactgct tatgctaata 15180 
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gtgtctttaa 


catttigtcaa 


gctgttacag 


S226CAS111. 
ccaatgtaaa 


ST25 

tgcacttctt 


tcaactgatg 


15240 


gtaataagat 


agctgacaag 


tatgtccgca 


atctacaaca 


caggctctat 


gagtgtctct 


15300 


atagaaatag 


ggatgttgat 


catgaattcg 


tggatgagtt 


ttacgcttac 


ctgcgtaaac 


15360 


atttctccat 


gatgattctt 


tctgatgatg 


ccgttgtgtg 


ctataacagt 


aactatgcgg 


15420 


ctcaaggttt 


agtagctagc 


attaagaact 


ttaaggcagt 


tctttattat 


caaaataatg 


15480 


tgttcatgtc 


tgaggcaaaa 


tgttggactg 


agactgacct 


tactaaagga 


cctcacgaat 


15540 


tttgctcaca 


gcatacaatg 


ctagttaaac 


aaggagatga 


ttacgtgtac 


ctgccttacc 


15600 


cagatccatc 


aagaanatta 


ggcgcaggct 


gttttgtcga 


tgatattgtc 


aaaacagatg 


15660 


gtacacttat 


gattgaaagg 


ttcgtgtcac 


tggctattga 


tgcttaccca 


cttacaaaac 


15720 


atcctaatca 


ggagnatgct 


gatgtctttc 


acttgtattt 


acaatacatt 


agaaagttac 


15780 


atgatgagct 


tactggccac 


atgttggaca 


tgtattccgt 


aatgctaact 


aatgataaca 


15840 


cctcacggta 


ctgggaacct 


gagttttatg 


aggctatgta 


cacaccacat 


acagtcttgc 


15900 


aggctgtagg 


tgcttgtgta 


ttgtgcaatt 


cacagacttc 


acttcgttgc 


ggtgcctgta 


15960 


ttaggagacc 


attcctatgt 


tgcaagtgct 


gctatgacca 


tgtcatttca 


acatcacaca 


16020 


aattagtgtt 


gtctgttaat 


ccctatgttt 


gcaatgcccc 


aggttgtgat 


gtcactgatg 


16080 


tgacacaact 


gtatctagga 


ggtatgagct 


attattgcaa 


gtcacataag 


cctcccatta 


16140 


gttttccatt 


atgtgctaat 


ggtcaggttt 


ttggtttata 


caaaaacaca 


tgtgtaggca 


16200 


gtgacaatgt 


cactgacttc 


aatgcgatag 


caacatgtga 


ttggactaat 


gctggcgatt 


16260 


acatacttgc 


caacacttgt 


actgagagac 


tcaagctttt 


cgcagcagaa 


acgctcaaag 


16320 


ccactgagga 


aacatttaag 


ctgtcatatg 


gtattgccac 


tgtacgcgaa 


gtactctctg 


16380 


acagagaatt 


gcatctttca 


tgggaggttg 


gaaaacctag 


accaccattg 


aacagaaact 


16440 


atgtctttac 


tggtt:accgt 


gtaactaaaa 


atagtaaagt 


acagattgga 


gagtacacct 


16500 


ttgaaaaagg 


tgactatggt 


gatgctgttg 


tgtacagagg 


tactacgaca 


tacaagttga 


16560 


atgttggtga 


ttactttgtg 


ttgacatctc 


acactgtaat 


gccacttagt 


gcacctactc 


16620 


tagtgccaca 


agagcactat 


gtgagaatta 


ctggcttgta 


cccaacactc 


aacatctcag 


16680 


atgagttttc 


tagcaatgtt 


gcaaattatc 


aaaaggtcgg 


catgcaaaag 


tactctacac 


16740 


tccaaggacc 


acctggtact 


ggtaagagtc 


attttgccat 


cggacttgct 


ctctattacc 


16800 


catctgctcg 


catagtgtat 


acggcatgct 


ctcatgcagc 


tgttgatgcc 


ctatgtgaaa 


16860 


aggcattaaa 


atatttgccc 


atagataaat 


gtagtagaat 


catacctgcg 


cgtgcgcgcg 


16920 


tagagtgttt 


tgataaattc 


aaagtgaatt 


caacactaga 


acagtatgtt 


ttctgcactg 


16980 


taaatgcatt 


gccagaaaca 


actgctgaca 


ttgtagtctt 


tgatgaaatc 


tctatggcta 


17040 


ctaattatga 


cttgagtgtt 


gtcaatgcta 


gacttcgtgc 


aaaacactac 


gtctatattg 


17100 


gcgatcctgc 


tcaat:tacca 


gccccccgca 


cattgctgac 


taaaggcaca 


ctagaaccag 


17160 


aatattttaa 


ttcagtgtgc 


agacttatga 


aaacaatagg 


tccagacatg 


ttccttggaa 


17220 
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cttgtcgccg ttgtcctgct gaaattgttg acactgtgag tgctttagtt tatgacaata 17280 

agctaaaagc acacaaggat aagtcagctc aatgcttcaa aatgttctac aaaggtgtta 17340 

ttacacatga tgtttcatct gcaatcaaca gacctcaaat aggcgttgta agagaatttc 17400 

ttacacgcaa tcctgcttgg agaaaagctg tttttatctc accttataat tcacagaacg 17460 

ctgtagcttc aaaaatctta ggattgccta cgcagactgt tgattcatca cagggttctg 17520 

aatatgacta tigtcatattc acacaaacta ctgaaacagc acactcttgt aatgtcaacc 17580 

gcttcaatgt ggctatcaca agggcaaaaa ttggcatttt gtgcataatg tctgatagag 17640 

atctttatga caaactgcaa tttacaagtc tagaaatacc acgtcgcaat gtggctacat 17700 

tacaagcaga aaatgtaact ggacttttta aggactgtag taagatcatt actggtcttc 17760 

atcctacaca ggcacctaca cacctcagcg ttgatataaa gttcaagact gaaggattat 17820 

gtgttgacat accaggcata ccaaaggaca tgacctaccg tagactcatc tctatgatgg 17880 

gtttcaaaat gaattaccaa gtcaatggtt accctaatat gtttatcacc cgcgaagaag 17940 

ctattcgtca cgttcgtgcg tggattggct ttgatgtaga gggctgtcat gcaactagag 18000 

atgctgtggg tractaaccta cctctccagc taggattttc tacaggtgtt aacttagtag 18060 

ctgtaccgac tggttatgtt gacactgaaa ataacacaga attcaccaga gttaatgcaa 18120 

aacctccacc aggtgaccag tttaaacatc ttataccact catgtataaa ggcttgccct 18180 

ggaatgtagt gcgtattaag atagtacaaa tgctcagtga tacactgaaa ggattgtcag 18240 

acagagtcgt gttcgtcctt tgggcgcatg gctttgagct tacatcaatg aagtactttg 18300 

tcaagattgg acctgaaaga acgtgttgtc tgtgtgacaa acgtgcaact tgcttttcta 18360 

cttcatcaga tacttatgcc tgctggaatc attctgtggg ttttgactat gtctataacc 18420 

catttatgat tgatgttcag cagtggggct ttacgggtaa ccttcagagt aaccatgacc 18480 

aacattgcca ggtacatgga aatgcacatg tggctagttg tgatgctatc atgactagat 18540 

gtttagcagt ccatgagtgc tttgttaagc gcgttgattg gtctgttgaa taccctatta 18600 

taggagatga actgagggtt aattctgctt gcagaaaagt acaacacatg gttgtgaagt 18660 

ctgcattgct tgctgataag tttccagttc ttcatgacat tggaaatcca aaggctatca 18720 

agtgtgtgcc tcaggctgaa gtagaatgga agttctacga tgctcagcca tgtagtgaca 18780 

aagcttacaa aatagaggaa ctcttctatt cttatgctac acatcacgat aaattcactg 18840 

atggtgtttg tttgttttgg aattgtaacg ttgatcgtta cccagccaat gcaattgtgt 18900 

gtaggtttga cacaagagtc ttgtcaaact tgaacttacc aggctgtgat ggtggtagtt 18960 

tgtatgtgaa taagcatgca ttccacactc cagctttcga taaaagtgca tttactaatt 19020 

taaagcaatt gcctttcttt tactattctg atagtccttg tgagtctcat ggcaaacaag 19080 

tagtgtcgga tattgattat gttccactca aatctgctac gtgtattaca cgatgcaatt 19140 

taggtggtgc ngtttgcaga caccatgcaa atgagtaccg acagtacttg gatgcatata 19200 

atatgatgat ntctgctgga tttagcctat ggatttacaa acaatttgat acttataacc 19260 
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tgtggaatac 


atttaccagg 


ttacagagtt 


S226CAS111.ST25 
tagaaaatgt ggcttataat 


gttgttaata 


19320 


aaggacactt 


tgatggacac 


gccggcgaag 


cacctgtttc 


catcattaat 


aatgctgttt 


19380 


acacaaaggt 


agatggtatt 


gatgtggaga 


tctttgaaaa 


taagacaaca 


cttcctgtta 


19440 


atgttgcatt 


tgagctttgg 


gctaagcgta 


acattaaacc 


agtgccagag 


attaagatac 


19500 


tcaataattt 


gggtgttgat 


atcgctgcta 


atactgtaat 


ctgggactac 


aaaagagaag 


19560 


ccccagcaca 


tgtatctaca 


ataggtgtct 


gcacaatgac 


tgacattgcc 


aagaaaccta 


19620 


ctgagagtgc 


ttgttcttca 


cttactgtct 


tgtttgatgg 


tagagtggaa 


ggacaggtag 


19680 


acctttttag 


aaacgcccgt 


aatggtgttt 


taataacaga 


aggttcagtc 


aaaggtctaa 


19740 


caccttcaaa 


gggaccagca 


caagctagcg 


tcaatggagt 


cacattaatt 


ggagaatcag 


19800 


taaaaacaca 


gtttaactac 


tttaagaaag 


tagacggcat 


tattcaacag 


ttgcctgaaa 


19860 


cctactttac tcagagcaga 


gacttagagg 


attttaagcc 


cagatcacaa 


atggaaactg 


19920 


actttctcga gctcgctatg 


gatgaattca 


tacagcgata 


taagctcgag 


ggctatgcct 


19980 


tcgaacacat 


cgtttatgga 


gatttcagtc 


atggacaact 


tggcggtctt 


catttaatga 


20040 


taggcttagc 


caagcgctca 


caagattcac 


cacttaaatt 


agaggatttt 


atccctatgg 


20100 


acagcacagt 


gaaaaattac 


ttxataacag 


atgcgcaaac 


aggttcatca 


aaatgtgtgt 


20160 


gttctgtgat tgatctttta 


cttgatgact 


ttgtcgagat 


aataaagtca 


caagatttgt 


20220 


cagtgatttc 


aaaagtggtc 


aaggttacaa 


ttgactatgc 


tgaaatttca 


ttcatgcttt 


20280 


ggtgtaagga tggacatgtt 


gaaaccttct 


acccaaaact 


acaagcaagt 


caagcgtggc 


20340 


aaccaggtgt 


tgcgatgcct 


aacttgtaca 


agatgcaaag 


aatgcttctt 


gaaaagtgtg 


20400 


accttcagaa ttatggtgaa 


aatgctgtta 


taccaaaagg 


aataatgatg 


aatgtcgcaa 


20460 


agtatactca 


actgtgtcaa 


tacttaaata 


cacttacttt 


agctgtaccc 


tacaacatga 


20520 


gagttattca 


ctttggtgct 


ggctctgata 


aaggagttgc 


accaggtaca 


gctgtgctca 


20580 


gacaatggtt 


gccaactggc 


acactacttg 


tcgattcaga 


tcttaatgac 


ttcgtctccg 


20640 


acgcagattc tactttaatt 


ggagactgtg 


caacagtaca 


tacggctaat 


aaatgggacc 


20700 


ttattattag 


cgatatgtat 


gaccctagga 


ccaaacatgt 


gacaaaagag 


aatgactcta 


20760 


aagaagggtt 


tttcacttat 


ctgtgtggat 


ttataaagca 


aaaactagcc 


ctgggtggtt 


20820 


ctatagctgt 


aaagataaca 


gagcattctt 


ggaatgctga 


cctttacaag 


cttatgggcc 


20880 


atttctcatg 


gtggacagct 


tttgttacaa 


atgtaaatgc 


atcatcatcg 


gaagcatttt 


20940 


taattggggc 


taactatctt 


ggcaagccga 


aggaacaaat 


tgatggctat 


accatgcatg 


21000 


ctaactacat 


tttctggagg 


aacacaaatc 


ctatccagtt 


gtcttcctat 


tcactctttg 


21060 


acatgagcaa 


atttcctctt 


aaattaagag 


gaactgctgt 


aatgtctctt 


aaggagaatc 


21120 


aaatcaatga 


tatgatttat 


tctcttctgg 


aaaaaggtag 


gcttatcatt 


agagaaaaca 


21180 


acagagttgt 


ggtttcaagt 


gatattcttg 


ttaacaacta 


a 




21221 



<210> 32 
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<211> 297 
<212> DNA 
<213> CORONAVIRUS 



<400> 32 

atggacccca atcaaaccaa cgtagtgccc cccgcattac atttggtgga cccacagatt 60 

caactgacaa taaccagaat ggaggacgca atggggcaag gccaaaacag cgccgacccc 120 

aaggtttacc caataatact gcgtctitggt tcacagctct cactcagcat ggcaaggagg 180 

aacttagatt ccctcgaggc cagggcgttc caatcaacac caatagtggt ccagatgacc 240 

aaattggcta ctaccgaaga gctacccgac gagttcgtgg tggtgacggc aaaatga 297 

<210> 33 

<211> 98 

<212> PRT 

<213> CORONAVIRUS 

<400> 33 

Met Asp Pro Asn Gin Thr Asn val val Pro Pro Ala Leu His Leu val 
15 10 15 

Asp Pro Gin lie Gin Leu Thr lie Thr Arg Met Glu Asp Ala Met Gly 
20 25 30 

Gin Gly Gin Asn Ser Ala Asp Pro Lys Val Tyr Pro lie lie Leu Arg 
35 40 45 

Leu Gly Ser Gin Leu Ser Leu ser Met Ala Arg Arg Asn Leu Asp ser 
50 55 60 

Leu Glu Ala Arg Ala Phe Gin Ser Thr Pro lie Val Val Gin Met Thr 
65 70 75 80 

Lys Leu Ala Thr Thr Glu Glu Leu Pro Asp Glu Phe Val Val Val Thr 
85 90 95 

Ala Lys 



<210> 34 

<211> 213 

<212> DNA 

<213> CORONAVIRUS 
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<400> 34 

atgctgccac cgtgctacaa cttcctcaag gaacaacatt gccaaaaggc ttctacgcag 60 

agggaagcag aggcggcagt caagcctctt ctcgctcctc atcacgtagt cgcggtaatt 120 

caagaaattc aactcctggc agcagtaggg gaaattctcc tgctcgaatg gctagcggag 180 

gtggtgaaac tgccctcgcg ctattgctgc tag 213 

<210> 35 

<211> 70 

<212> PRT 

<213> CORONAVIRUS 



<400> 35 

Met Leu Pro Pro Cys Tyr Asn Phe Leu Lys Glu Gin His Cys Gin Lys 
1 5 10 15 

Ala Ser Thr Gin Arg Glu Ala Glu Ala Ala val Lys Pro Leu Leu Ala 
20 25 30 

pro His His val Val Ala Val lie Gin Glu lie Gin Leu Leu Ala Ala 
35 40 45 

val Gly Glu lie Leu Leu Leu Glu Trp Leu Ala Glu Val val Lys Leu 
50 55 60 

Pro Ser Arg Tyr cys cys 
65 70 

<210> 36 

<211> 1377 

<212> DNA 

<213> CORONAVIRUS 



<220> 

<221> CDS 

<222> (67).. (1335) 

<223> 



<400> 36 ,_ 
atgaaggtca ccaaactgct gcatttagag acgtacttgt tgttttaaat aaacgaacaa 60 
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attaaa atg tct gat aat gga ccc caa tea aac caa cgt agt gec ccc 108 
Met ser Asp Asn Gly pro Gin Ser Asn Gin Arg ser Ala Pro 
1 5 10 

cgc att aca ttt ggt gga ccc aca gat tea act gac aat aac cag aat 156 

Arg lie Thr Phe Gly Gly Pro Thr Asp ser Thr Asp Asn Asn Gin Asn 

15 20 25 30 

gga gga cgc aat ggg gca agg cca aaa cag cgc cga ccc caa ggt tta 204 

Gly Gly Arg Asn Gly Ala Arg pro Lys Gin Arg Arg Pro Gin Gly Leu 
35 40 45 

ccc aat aat act gcg tct tgg ttc aca get etc act cag cat ggc aag 252 

Pro Asn Asn Thr Ala Ser Trp Phe Thr Ala Leu Thr Gin His Gly Lys 
50 55 60 

gag gaa ctt aga ttc cct cga ggc cag ggc gtt cca ate aac ace aat 300 

Glu Glu Leu Arg Phe Pro Arg Gly Gin Gly Val Pro lie Asn Thr Asn 

65 ~ 70 75 

agt ggt cca gat gac caa att ggc tac tac cga aga get acc cga cga 348 

Ser Gly Pro Asp Asp Gin lie Gly Tyr Tyr Arg Arg Ala Thr Arg Arg 
80 85 90 

gtt cgt ggt ggt gac ggc aaa atg aaa gag etc age ccc aga tgg tac 396 

Val Arg Gly Gly Asp Gly Lys Met Lys Glu Leu ser Pro Arg Trp Tyr 

95 100 105 " 110 

ttc tat tac eta gga act ggc cca gaa get tea ctt ccc tac ggc get 444 

Phe Tyr Tyr Leu Gly Thr Gly Pro Glu Ala Ser Leu Pro Tyr Gly Ala 
115 120 125 

aac aaa gaa ggc ate gta tgg gtt gca act gag gga gee ttg aat aca 492 

Asn Lys Glu Gly lie val Trp val Ala Thr Glu Gly Ala Leu Asn Thr 
130 135 140 

ccc aaa gac cac att ggc acc cgc aat cct aat aac aat get gee acc 540 

Pro Lys Asp His lie Gly Thr Arg Asn Pro Asn Asn Asn Ala Ala Thr 

145 150 155 

gtg eta caa ctt cct caa gga aca aca ttg cca aaa ggc ttc tac gca 588 

VaT Leu Gin Leu Pro Gin Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala 
160 165 170 

gag gga age aga ggc ggc agt caa gee tct tct cgc tec tea tea cgt 636 

Glu Gly ser Arg Gly Gly Ser Gin Ala Ser Ser Arg Ser Ser Ser Arg 

175 180 185 190 



agt cgc ggt aat tea aga aat tea act cct ggc age agt agg gga aat 684 
Ser Arg Gly Asn Ser Arg Asn Ser Thr Pro Gly Ser ser Arg Gly Asn 
195 200 205 



tct cct get cga atg get age gga ggt ggt gaa act gee etc gcg eta 732 

Ser pro Ala Arg Met Ala ser Gly Gly Gly Glu Thr Ala Leu Ala Leu 

210 215 220 

ttg ctg eta gac aga ttg aac cag ctt gag age aaa gtt tct ggt aaa 780 

Leu Leu Leu Asp Arg Leu Asn Gin Leu Glu ser Lys Val Ser Gly Lys 

225 230 235 

ggc caa caa caa caa ggc caa act gtc act aag aaa tct get get gag 

Gly Gin Gin Gin Gin Gly Gin Thr val Thr Lys Lys ser Ala Ala Glu 
240 245 250 



828 



gca tct aaa aag cct cgc caa aaa cgt act gee aca aaa cag tac aac 876 
Ala ser Lys Lys Pro Arg Gin Lys Arg Thr Ala Thr Lys Gin Tyr Asn 
255 260 265 270 
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gtc act caa gca ttt ggg aga 
val Thr Gin Ala Phe Gly Arg 
275 

ttc ggg gac caa gac eta ate 
Phe Gly Asp Gin Asp Leu lie 
290 

ccg caa att gca caa ttt get 
pro Gin lie Ala Gin Phe Ala 
305 

tea cgc att ggc atg gaa gtc 
ser Arg lie Gly Met Glu val 
320 325 

cat gga gee att aaa ttg gat 
His Gly Ala lie Lys Leu Asp 
335 340 

gtc ata ctg ctg aac aag cac 
Val lie Leu Leu Asn Lys His 
355 

aca gag cct aaa aag gac aaa 
Thr Glu Pro Lys Lys Asp Lys 
370 

ttg ccg cag aga caa aag aag 
Leu Pro Gin Arg Gin Lys Lys 
385 

get gac atg gat gat ttc tec 
Ala Asp Met Asp Asp Phe Ser 
400 405 

get tct get gat tea act cag 
Ala ser Ala Asp ser Thr Gin 
415 420 

aggcagatgg gctatgtaaa eg 



S226CAS111.ST25 
cgt ggt cca gaa caa acc caa gga aat 
Arg Gly Pro Glu Gin Thr Gin Gly Asn 



280 



285 



aga caa gga act gat tac aaa cat tgg 
Arg Gin Gly Thr Asp Tyr Lys His Trp 



295 



300 



cca agt gec tct gca ttc ttt gga atg 
Pro ser Ala ser Ala Phe Phe Gly Met 
310 315 

aca cct teg gga aca tgg ctg act tat 

Thr Pro Ser Gly Thr Trp Leu Thr Tyr 
330 

gac aaa gat cca caa ttc aaa gac aac 

Asp Lys Asp Pro Gin Phe Lys Asp Asn 
345 350 

att gac gca tac aaa aca ttc cca cca 
lie Asp Ala Tyr Lys Thr Phe Pro Pro 
360 365 

aag aaa aag act gat gaa get cag cct 
Lys Lys Lys Thr Asp Glu Ala Gin Pro 
375 380 

cag ccc act gtq act ctt ctt cct gcg 
Gin Pro Thr Val Thr Leu Leu Pro Ala 
390 395 

aga caa ctt caa aat tec atg agt gga 
Arg Gin Leu Gin Asn ser Met ser Gly 
410 

gca taa acactcatga tgaccacaca 
Ala 



924 



972 



1020 



1068 



1116 



1164 



1212 



1260 



1308 



1355 



1377 



<210> 37 

<211> 422 

<212> PRT 

<213> CORONAVIRUS 

<400> 37 

Met ser Asp Asn Gly Pro Gin Ser Asn Gin Arg ser Ala Pro Arg lie 
15 10 15 

Thr Phe Gly Gly Pro Thr Asp ser Thr Asp Asn Asn Gin Asn Gly Gly 
20 25 30 

Arg Asn Gly Ala Arg Pro Lys Gin Arg Arg Pro Gin Gly Leu Pro Asn 
35 40 45 



Asn Thr Ala ser Trp Phe Thr Ala Leu Thr Gin His Gly Lys Glu Glu 
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50 55 60 

Leu Arg Phe Pro Arg Gly Gin Gly val Pro lie Asn Thr Asn Ser Gly 
65 70 75 80 

pro Asp Asp Gin lie Gly Tyr Tyr Arg Arg Ala Thr Arg Arg val Arg 
85 90 95 

Gly Gly Asp Gly Lys Met Lys Glu Leu Ser Pro Arg Trp Tyr Phe Tyr 
100 105 110 

Tyr Leu Gly Thr Gly Pro Glu Ala ser Leu Pro Tyr Gly Ala Asn Lys 
115 120 125 

Glu Gly lie val Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys 
130 135 140 

Asp His lie Gly Thr Arg Asn Pro Asn Asn Asn Ala Ala Thr Val Leu 
145 150 155 160 

Gin Leu Pro Gin Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly 
165 170 175 

Ser Arg Gly Gly Ser Gin Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg 
180 185 190 

Gly Asn Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Asn Ser Pro 
195 200 205 

Ala Arg Met Ala Ser Gly Gly Gly Glu Thr Ala Leu Ala Leu Leu Leu 
210 215 220 

Leu Asp Arg Leu Asn Gin Leu Glu Ser Lys Val Ser Gly Lys Gly Gin 
225 230 235 240 

Gin Gin Gin Gly Gin Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser 
245 250 255 

Lys Lys Pro Arg Gin Lys Arg Thr Ala Thr Lys Gin Tyr Asn Val Thr 
260 ~ 265 270 

Gin Ala Phe Gly Arg Arg Gly Pro Glu Gin Thr Gin Gly Asn Phe Gly 
275 280 285 

Asp Gin Asp Leu lie Arg Gin Gly Thr Asp Tyr Lys His Trp Pro Gin 
290 295 300 

lie Ala Gin Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg 
305 310 315 320 

lie Gly Met Glu Val Thr Pro ser Gly Thr Trp Leu Thr Tyr His Gly 
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325 330 335 

Ala He Lys Leu Asp Asp Lys Asp Pro Gin Phe Lys Asp Asn Val lie 
340 345 350 

Leu Leu Asn Lys His lie Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu 
355 360 365 

Pro Lys Lys Asp Lys Lys Lys Lys Thr Asp Glu Ala Gin Pro Leu Pro 
370 375 380 

Gin Arg Gin Lys Lys Gin Pro Thr val Thr Leu Leu Pro Ala Ala Asp 
385 390 395 400 

Met Asp Asp Phe Ser Arg Gin Leu Gin Asn ser Met Ser Gly Ala Ser 
405 410 415 

Ala Asp Ser Thr Gin Ala 
420 

<210> 38 

<211> 1377 

<212> DNA 

<213> CORONAVIRUS 



<400> 38 
atgaaggtca 


ccaaactgct 


gcatttagag 


acgtacttgt 


tgttttaaat 


aaacgaacaa 


60 


attaaaatgt 


ctgataatgg 


accccaatca 


aaccaacgta 


gtgccccccg 


cattacattt 


120 


ggtggaccca 


cagattcaac 


tgacaataac 


cagaatggag 


gacgcaatgg 


ggcaaggcca 


180 


aaacagcgcc 


gaccccaagg 


tttacccaat 


aatactgcgt 


cttggttcac 


agctctcact 


240 


cagcatggca 


aggaggaact 


tagattccct 


cgaggccagg 


gcgttccaat 


caacaccaat 


300 


agtggtccag 


atgaccaaat 


tggctactac 


cgaagagcta 


cccgacgagt 


tcgtggtggt 


360 


gacggcaaaa 


tgaaagagct 


cagccccaga 


tggtacttct 


attacctagg 


aactggccca 


420 


gaagcttcac 


ttccctacgg 


cgctaacaaa 


gaaggcatcg 


tatgggttgc 


aactgaggga 


480 


gccttgaata 


cacccaaaga 


ccacattggc 


acccgcaatc 


ctaataacaa 


tgctgccacc 


540 


gtgctacaac 


ttcctcaagg 


aacaacattg 


ccaaaaggct 


tctacgcaga 


gggaagcaga 


600 


ggcggcagtc 


aagcctcttc 


tcgctcctca 


tcacgtagtc 


gcggtaattc 


aagaaattca 


660 


actcctggca 


gcagtagggg 


aaattctcct 


gctcgaatgg 


ctagcggagg 


tggtgaaact 


720 


gccctcgcgc 


tattgctgct 


agacagattg 


aaccag cttg 


agagcaaagt 


ttctggtaaa 


780 


ggccaacaac 


aacaaggcca 


aactgtcact 


aagaaatctg 


ctgctgaggc 


atctaaaaag 


840 


cctcgccaaa 


aacgtactgc 


cacaaaacag 


tacaacgtca 


ctcaagcatt 


tgggagacgt 


900 
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ggtccagaac aaacccaagg 


aaatttcggg 


gaccaagacc 


taatcagaca 


aggaactgat 


960 


tacaaacatt ggccgcaaat 


tgcacaattt 


gctccaagtg 


cctctgcatt 


ctttggaatg 


1020 


tcacgcattg gcatggaagt 


cacaccttcg 


ggaacatggc 


tgacttatca 


tggagccatt 


1080 


dad L Ly yd Ly aLaaayalut 


dv_da. l_ LLuau 


aacaacatca 


"tactactaaa 


caagcaca"t"t 


1140 


gacgcataca aaacattccc 


accaacagag 


cctaaaaagg 


acaaaaagaa 


aaagactgat 


1200 


gaagctcagc ctttgccgca 


gagacaaaag 


aagcagccca 


ctgtgactct 


tcttcctgcg 


1260 


gctgacatgg atgatttctc 


cagacaactt 


caaaattcca 


tgagtggagc 


ttctgctgat 


1320 


tcaactcagg cataaacact 


catgatgacc 


acacaaggca 


gatgggctat 


gtaaacg 


1377 



<210> 39 

<211> 204 

<212> DNA 

<213> CORONAVIRUS 



<400> 39 

atattaggtt tttacctacc caggaaaagc caaccaacct cgatctcttg tagatctgtt 60 

ctctaaacga actttaaaat ctgtgtagct gtcgctcggc tgcatgccta gtgcacctac 120 

gcagtataaa caataataaa ttttactgtc gttgacaaga aacgagtaac tcgtccctct 180 

tctgcagact gcttacggtt tcgt 204 

<210> 40 

<211> 809 

<212> DNA 

<213> CORONAVIRUS 



<400> 40 

actcaagcat ttgggagacg 


tggtccagaa 


caaacccaag 


gaaatttcgg 


ggaccaagac 


60 


ctaatcagac aaggaactga 


ttacaaacat tggccgcaaa ttgcacaatt 


tgctccaagt 


120 


gcctctgcat tctttggaat 


gtcacgcatt 


ggcatggaag 


tcacaccttc 


gggaacatgg 


180 


ctgacttatc atggagccat 


taaattggat 


gacaaagatc 


cacaattcaa 


agacaacgtc 


240 


atactgctga acaagcacat 


tgacgcatac 


aaaacattcc 


caccaacaga 


gcctaaaaag 


300 


gacaaaaaga aaaagactga 


tgaagctcag 


cctttgccgc 


agagacaaaa 


gaagcagccc 


360 


actgtgactc ttcttcctgc 


ggctgacatg 


gatgatttct 


ccagacaact 


tcaaaattcc 


420 


atgagtggag cttctgctga 


ttcaactcag 


gcataaacac 


tcatgatgac 


cacacaaggc 


480 


agatgggcta tgtaaacgtt 


ttcgcaattc 


cgtttacgat 


acatagtcta 


ctcttgtgca 


540 


gaatgaattc tcgtaactaa 


acagcacaag taggtttagt 


taactttaat 


ctcacatagc 


600 
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aatctttaat caatgtgtaa cattagggag gacttgaaag agccaccaca ttttcatcga 660 

ggccacgcgg agtacgatcg agggtacagt gaataatgct agggagagct gcctatatgg 720 

aagagcccta atgtgtaaaa ttaattttag tagtgctatc cccatgtgat tttaatagct 780 

tcttaggaga atgacaaaaa aaaaaaaaa 809 

<210> 41 

<211> 448 

<212> DNA 

<213> CORONAVIRUS 



<400> 41 

aatgaacaca tagggctgtt 


caagctgggg 


cagtacgcct 


ttttccagct 


ctactagacc 


60 


acaagtgcca tttttgaggt 


gttcacgtgc 


ctccgatagg 


gcctcttcca 


cagagtcccc 


120 


gaagccacgc actagcacgt 


ctctaacctg 


aaggacaggc aaactgagtt 


ggacgtgtgt 


180 


tttctcgttg acaccaagaa 


caaggctctc 


catcttacct 


ttcggtcaca. 


cccggacgaa 


240 


acctaggtat gctgatgatc 


gactgcaaca 


cggacgaaac 


cgtaagcagt 


ctgcagaaga 


300 


gggacgagtt actcgtttct 


tgtcaacgac 


agtaaaattt 


attattgttt 


atactgcgta 


360 


ggtgcactag gcatgcagcc 


gagcgacagc 


tacacagatt 


ttaaagttcg 


tttagagaac 


420 


agatctacaa gagatcgagg 


ttggttgg 








448 



<210> 42 

<211> 2033 

<212> DNA 

<213> CORONAVIRUS 



<400> 42 
atacctaggt 


ttcgtccggg 


tgtgaccgaa 


aggtaagatg 


gagagccttg 


ttcttggtgt 


60 


caacgagaaa 


acacacgtcc 


aactcagttt 


gcctgtcctt 


caggttagag 


acgtgctagt 


120 


gcgtggcttc 


ggggactctg 


tggaagaggc 


cctatcggag 


gcacgtgaac 


acctcaaaaa 


180 


tggcacttgt 


ggtctagtag 


agctggaaaa 


aggcgtactg 


ccccagcttg 


aacagcccta 


240 


tgtgttcatt 


aaacgttctg 


atgccttaag 


caccaatcac 


ggccacaagg 


tcgttgagct 


300 


ggttgcagaa 


atggacggca 


ttcagtacgg 


tcgtagcggt 


ataacactgg 


gagtactcgt 


360 


gccacatgtg 


ggcgaaaccc 


caattgcata 


ccgcaatgtt 


cttcttcgta 


agaacggtaa 


420 


taagggagcc 


ggtggtcata 


gctatggcat 


cgatctaaag 


tcttatgact 


taggtgacga 


480 


gcttggcact 


gatcccattg 


aagattatga 


acaaaactgg 


aacactaagc 


atggcagtgg 


540 


tgcactccgt 


gaactcactc 


gtgagctcaa 


tggaggtgca 


gtcactcgct 


atgtcgacaa 


600 
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ST25 

aaagattttc 


tcgcacgcgc 


660 


gggcaagtca 


atgtgcactc 


tttccgaaca 


acttgattac 


atcgagtcga 


agagaggtgt 


720 


ctactgctgc 


cgtgaccatg 


agcatgaaat 


tgcctggttc 


actgagcgct 


ctgataagag 


780 


ctacgagcac 


cagacaccct 


tcgaaattaa 


gagtgccaag 


aaatttgaca 


ctttcaaagg 


840 


ggaatgccca 


aagtttgtgt 


ttcctcttaa 


ctcaaaagtc 


aaagtcattc 


aaccacgtgt 


900 


tgaaaagaaa 


aagactgagg 


gtttcatggg 


gcgtatacgc 


tctgtgtacc 


ctgttgcatc 


960 


tccacaggag 


tgtaacaata 


tgcacttgtc 


taccttgatg 


aaatgtaatc 


attgcgatga 


1020 


agtttcatgg 


cagacgtgcg 


actttctgaa 


agccacttgt 


gaacattrgtg 


gcactgaaaa 


1080 


tttagttatt 


gaaggaccta 


ctacatgtgg 


gtacctacct 


actaatgctg 


tagtgaaaat 


1140 


gccatgtcct 


gcctgtcaag 


acccagagat 


tggacctgag 


catagtgttg 


cagattatca 


1200 


caaccactca 


aacattgaaa 


ctcgactccg 


caagggaggt 


aggactagat 


gttttggagg 


1260 


ctgtgtgttt 


gcctatgttg 


gctgctataa 


taagcgtgcc 


tactgggttc 


ctcgtgctag 


1320 


tgctgatatt 


ggctcaggcc 


atactggcat 


tactggtgac 


aatgtggaga 


ccttgaatga 


1380 


ggatctcctt 


gagatactga 


gtcgtgaacg 


tgttaacatt 


aacattgttg 


gcgattttca 


1440 


tttgaatgaa 


gaggttgcca 


tcattttggc 


atctttctct 


gcttctacaa 


gtgcctttat 


1500 


tgacactata 


aagagtcttg 


attacaagtc 


tttcaaaacc 


attgttgagt 


cctgcggtaa 


1560 


ctataaagtt 


accaagggaa 


agcccgtaaa 


aggtgcttgg 


aacattggac 


aacagagatc 


1620 


agttttaaca 


ccactgtgtg 


gttttccctc 


acaggctgct 


ggtgttatca 


gatcaatttt 


1680 


tgcgcgcaca 


cttgatgcag 


caaaccactc 


aattcctgat 


ttgcaaagag 


cagctgtcac 


1740 


catacttgat 


ggtatttctg 


aacagtcatt 


acgtcttgtc 


gacgccatgg 


tttatacttc 


1800 


agacctgctc 


accaacagtg 


tcattattat 


ggcatatgta 


actggtggtc 


ttgtacaaca 


men 

I860 


aacttctcaa 


taattatcta 


atcttttaaa 


cactactgtt 


gaaaaactca 


ggcctatctt 


1920 


tgaatggatt 


gaggcgaaac 


ttaatacaaa 


agttgaattt 


ctcaaggatg 


cttgggagat 


1980 


tctcaaattt 


ctcattacag 


qtgtttttga 


catcgtcaag 


ggtcaaatac 


agg 


2033 


<210> 43 














<2U> 2018 












<212> DNA 














<213> CORONAVIRUS 












<400> 43 
ggattgaggc 


gaaacttagt 


gcaggagttg 


aatttctcaa 


ggatgcttgg 


gagattctca 


60 


aatttctcat 


tacaggtgtt 


tttgacatcg 


tcaagggtca 


aatacaggtt 


gcttcagata 


120 


acatcaagga 


ttgtgtaaaa 


tgcttcattg 


atgttgttaa 


caaggcactc 


gaaatgtgca 


180 


ttgatcaagt 


cactatcgct 


ggcgcaaagt 


tgcgatcact 


caacttaggt 


gaagtcttca 


240 
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tcgctcaaag caagggactt taccgtcagt gtatacgtgg caaggagcag ctgcaactac 300 

tcatgcctct taaggcacca aaagaagtaa cctttcttga aggtgattca catgacacag 360 

tacttacctc tgaggaggtt gttctcaaga acggtgaact cgaagcactc gagacgcccg 420 

ttgatagctt cacaaatgga gctatcgttg gcacaccagt ctgtgtaaat ggcctcatgc 480 

tcttagagat taaggacaaa gaacaatact gcgcattgtc tcctggttta ctggctacaa 540 

acaatgtctt tcgcttaaaa gggggtgcac caattaaagg tgtaaccttt ggagaagata 600 

ctgtttggga agttcaaggt tacaagaatg tgagaatcac atttgagctt gatgaacgtg 660 

ttgacaaagt gcttaatgaa aagtgctctg tctacactgt tgaatccggt accgaagtta 720 

ctgagtttgc atgtgttgta gcagaggctg ttgtgaagac tttacaacca gtttctgatc 780 

tccttaccaa catgggtatt gatcttgatg agtggagtgt agctacattc tacttatttg 840 

atgatgctgg tgaagaaaac ttttcatcac gtatgtattg ttccttttac cctccagatg 900 

aggaagaaga ggacgatgca gagtgtgagg aagaagaaat tgatgaaacc tgtgaacatg 960 

agtacggtac agaggatgat tatcaaggtc tccctctgga atttggtgcc tcagctgaaa 1020 

cagttcgagt tgaggaagaa gaagaggaag actggctgga tgatactact gagcaatcag 1080 

agattgagcc agaaccagaa cctacacctg aagaaccagt taatcagttt actggttatt 1140 

taaaacttac tgacaatgtt gccattaaat gtgttgacat cgttaaggag gcacaaagtg 1200 

ctaatcctat ggtgattgta aatgctgcta acatacacct gaaacatggt ggtggtgtag 1260 

caggtgcact caacaaggca accaatggtg ccatgcaaaa ggagagtgat gatmacatta 1320 

agctaaatgg ccctcttaca gtaggagggt cttgtttgct ttctggacat aatcttgcta 1380 

agaagtgtct gcatgttgtt ggacctaacc taaatgcagg tgaggacatc cagcttctta 1440 

aggcagcata tgaaaatttc aattcacagg acatcttact tgcaccattg ttgtcagcag 1500 

gcatatttgg tgctaaacca cttcagtctt tacaagtgtg cgtgcagacg gttcgtacac 1560 

aggtttatat tgcagtcaat gacaaagctc tttatgagca ggttgtcatg gattatcttg 1620 

ataacctgaa gcctagagtg gaagcaccta aacaagagga gccaccaaac acagaagatt 1680 

ccaaaactga ggagaaatct gtcgtacaga agcctgtcga tgtgaagcca aaaattaagg 1740 

cctgcattga tgaggttacc acaacactgg aagaaactaa gtttcttacc aataagttac 1800 

tcttgtttgc tgatatcaat ggtaagcttt accatgattc tcagaacatg cttagaggtg 1860 

aagatatgtc tttccttgag aaggatgcac cttacatggt aggtgatgtt atcactagtg 1920 

gtgatatcac ttgtgttgta ataccctcca aaaaggctgg tggcactact gagatgctct 1980 

caagagcttt gaagaaagtg ccagttgatg agtatata 2018 

<210> 44 
<211> 1442 
<212> DNA 
<213> CORONAVIRUS 
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<400> 44 
ttgatgaggt 


taccacaaca 


ctggaagaaa 


ctaagtttct 


taccaataag 


ttactcttgt 


60 


ttgctgatat 


caatggtaag 


ctttaccatg 


attctcagaa 


catgcttaga 


ggtgaagata 


120 


tgtctttcct 


tgagaaggat 


gcaccttaca 


tggtaggtga 


tgttatcact 


agtggtgata 


180 


tcacttgtgt 


tgtaataccc 


tccaaaaagg 


ctggtggcac 


tactgagatg 


ctctcaagag 


240 


ctttgaagaa 


agtgccagtt 


gatgagtata 


taaccacgta 


ccctggacaa 


ggatgtgctg 


300 


gttatacact 


tgaggaagct 


aagactgctc 


ttaagaaatg 


caaatctgca 


ttttatgtac 


360 


taccttcaga 


agcacctaat 


gctaaggaag 


agattctagg 


aactgtatcc 


tggaatttga 


420 


gagaaatgct 


tgctcatgct 


gaagagacaa 


gaaaattaat 


gcctatatgc 


atggatgtta 


480 


gagccataat 


ggcaaccatc 


caacgtaagt 


ataaaggaat 


taaaattcaa 


gagggcatcg 


540 


ttgactatgg 


tgtccgattc 


ttcttttata 


ctagtaaaga 


gcctgtagct 


tctattatta 


600 


cgaagctgaa 


ctctctaaat 


gagccgcttg 


tcacaatgcc 


aattggttat 


gtgacacatg 


660 


gttttaatct 


tgaagaggct 


gcgcgctgta 


tgcgttctct 


taaagctcct 


gccgtagtgt 


720 


cagtatcatc 


accagatgct 


gttactacat 


ataatggata 


cctcacttcg 


tcatcaaaga 


780 


catctgagga 


gcactttgta 


gaaacagttt 


ctttggctgg 


ctcttacaga 


gattggtcct 


840 


attcaggaca 


gcgtacagag 


ttaggtgttg 


aatttcttaa 


gcgtggtgac 


aaaattgtgt 


900 


accacactct 


ggagagcccc 


gtcgagtttc 


atcttgacgg 


tgaggttctt 


tcacttgaca 


960 


aactaaagag 


tctcttatcc 


ctgcgggagg 


ttaagactat 


aaaagtgttc 


acaactgtgg 


1020 


acaacactaa 


tctccacaca 


cagcttgtgg 


atatgtctat 


gacatatgga 


cagcagtttg 


1080 


gtccaacata 


cttggatggt 


gctgatgtta 


caaaaattaa 


acctcatgta 


aatcatgagg 


1140 


gtaagacttt 


ctttgtacta 


cctagtgatg 


acacactacg 


tagtgaagct 


ttcgagtact 


1200 


accatactct 


tgatgagagt 


tttcttggta 


ggtacatgtc 


tgcttrtaaac 


cacacaaaga 


1260 


aatggaaatt 


tcctcaagtt 


ggtggtttaa 


cttcaattaa 


atgggctgat 


aacaattgtt 


1320 


atttgtctag 


tgttttatta 


gcacttcaac 


agcttgaagt 


caaattcaat 


gcaccagcac 


1380 


ttcaagaggc 


ttattataga 


gcccgtgctg 


gtgatgctgc 


taacttttgt 


gcactcatac 


1440 


tc 












1442 



<210> 45 

<211> 1050 

<212> DNA 

<213> CORONAVIRUS 

<400> 45 

atatgtctat gacatatgga cagcagtttg gtccaacata cttggatggt gctgatgtta 60 
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acctcatgta 


aatcatgagg 


S226CAS111.ST25 
gtaagacttt ctttgtacta 


cctagtgatg 


120 


acacactacg 


tagtgaagct 


ttcgagtact 


accatactct 


tgatgagagt 


tttcttggta 


180 


ggtacatgtc 


tgctttaaac 


cacacaaaga 


aatggaaatt 


tcctcaagtt 


ggtggtttaa 


240 


cttcaattaa 


atgggctgat 


aacaattgtt 


atttgtctag 


tgttttatta 


gcacttcaac 


300 


agcttgaagt 


caaattcaat 


gcaccagcac 


ttcaagaggc 


ttattataga 


gcccgtgctg 


360 


gtgatgctgc 


taacttttgt 


gcactcatac 


tcgcttacag 


taataaaact 


gttggcgagc 


420 


ttggtgatgt 


cagagaaact 


atgacccatc 


ttctacagca 


tgctaatttg 


gaatctgcaa 


480 


agcgagttct 


taatgtggtg 


tgtaaacatt 


gtggtrcagaa 


aactactacc 


ttaacgggtg 


540 


tagaagctgt 


gatgtatatg 


ggtactctat 


cttatgataa tcttaagaca 


ggtgtttcca 


600 


ttccatgtgt 


gtgtggtcgt 


gatgctacac 


aatatctagt 


acaacaagag 


tcttcttttg 


660 


ttatgatgtc 


tgcaccacct 


gctgagtata 


aattacagca 


aggtacattc 


ttatgtgcga 


720 


atgagtacac 


tggtaactat 


cagtgtggtc 


attacactca tataactgct 


aaggagaccc 


780 


tctatcgtat 


tgacggagct 


caccttacaa 


agatgtcaga gtacaaagga 


ccagtgactg 


840 


atgttttcta 


caaggaaaca 


tcttacacta 


caaccatcaa 


gcctgtgtcg 


tataaactcg 


900 


ataaaattac 


"ttacacaaaa 


attaaaccaa 


aattggatgg 


gtattataaa 


aaaaataata 


960 


cttactatac 


agagcagcct 


ataaarrttci 


taccaactca 


accattacca 


aatciroaatt 

clgl l y v_. y a y i_ l. 


1020 


ttgataattt 


caaactcaca 


tattctaaca 








1050 


<210> 46 














<211> 1995 












<212> DNA 














<213> CORONAVIRUS 












<400> 46 
tttgtgcact 


catactcgct 


tacagtaata 


aaactgttgg 


cgagcttggt 


gatgtcagag 


60 


aaactatgac 


ccatcttcta 


cagcatgcta 


atttggaatc 


tgcaaagcga 


gttcttaatg 


120 


tggtgtgtaa 


acattgtggt 


cagaaaacta 


ctaccttaac 


gggtgtagaa 


gctgtgatgt 


180 


atatgggtac 


tctatcttat 


gataatctta 


agacaggtgt 


ttccattcca 


tgtgtgtgtg 


240 


gtcgtgatgc 


tacacaatat 


ctagtacaac 


aagagtcttc 


ttttgttatg 


atgtctgcac 


300 


cacctgctga 


gtataaatta 


cagcaaggta 


cattcttatg 


tgcgaatgag 


tacactggta 


360 


actatcagtg 


tggtcattac 


actcatataa 


ctgctaagga 


gaccctctat 


cgtattgacg 


420 


gagctcacct 


tacaaagatg 


tcagagtaca 


aaggaccagt 


gactgatgtt 


ttctacaagg 


480 


aaacatctta 


cactacaacc 


atcaagcctg 


tgtcgtataa 


actcgatgga 


gttacttaca 


540 


cagagattga 


accaaaattg 


gatgggtatt 


ataaaaagga 


taatgcttac 


tatacagagc 


600 


agcctataga 


ccttgtacca 


actcaaccat 


taccaaatgc 


gagttttgat 


aatttcaaac 


660 
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taacacaaaa 


tttgctgatg 


S226CAS111 . 
atttaaatca 


ST25 

aatgacaggc 


ttcacaaagc 


720 


cagcttcacg 


agagctatct 


gtcacattct 


tcccagactt 


gaatggcgat 


gtagtggcta 


780 


ttgactatag 


acactattca 


gcgagtttca 


agaaaggtgc 


taaattactg 


cataagecaa 


840 


ttgtttggca 


cattaaccag 


gctacaacca 


agacaaegtt 


caaaccaaac 


acttggtgtt 


900 


tacgttgtct 


ttggagtaca 


aagecagtag 


atacttcaaa 


ttcatttgaa 


gttctggcag 


960 


tagaagacac 


acaaggaatg 


gacaatcttg 


cttgtgaaag 


tcaacaaccc 


acctctgaag 


1020 


aagtagtgga 


aaatcctacc 


atacagaagg 


aagtcataga 


gtgtgacgtg 


aaaactaccg 


1080 


aagttgtagg 


caatgtcata 


cttaaaccat 


cagatgaagg 


tgttaaagta 


acacaagagt 


1140 


taggtcatga 


ggatcttatg 


getgettatg 


tggaaaacac 


aagcattacc 


attaagaaac 


1200 


ctaatgagct 


ttcactagcc 


ttaggtttaa 


aaacaattgc 


cactcatggt 


attgetgeaa 


1260 


ttaatagtgt 


tccttggagt 


aaaattttgg 


cttatgtcaa 


accattctta 


ggacaagcag 


1320 


caattacaac 


ateaaattge 


gctaagagat 


tagcacaacg 


tgtgtttaac 


aattatatgc 


1380 


cttatgtgtt 


tacattattg 


ttccaattgt 


gtacttttac 


taaaagtacc 


aattctagaa 


1440 


ttagagcttc 


actacctaca 


actattgeta 


aaaatagtgt 


taagagtgtt 


gctaaattat 


1500 


gtttggatgc 


eggcattaat 


tatgtgaagt 


cacccaaatu 


ttctaaattg 


ttcacaatcg 


1560 


ctatgtggct 


attgttgtta 


agtatttget 


taggttctct 


aatctgtgta 


actgetgett 


1620 


ttggtgtact 


cttatctaat 


tttggtgctc 


cttcttattg 


taatggcgtt 


agagaattgt 


1680 


atcttaattc 


gtctaacgtt 


actactatgg 


atttctgtga 


aggttctttt 


ccttgcagca 


1740 


tttgtttaag 


tggattagac 


tcccttgatt 


cttatccagc 


tcttgaaacc 


attcaggtga 


1800 


cgatttcatc 


gtacaagcta 


gacttgacaa 


ttttaggtct 


ggcegctgag 


tgggttttgg 


1860 


catatatatt 


attraraaaa 


ttrttttatt 


tattannf rt 






1920 


tctttggcta 


ttttgctagt 








tttatratta 


1980 


gtattgtaca 


aatgg 










1995 


<210> 47 














<211> 1884 












<212> DNA 














<213> CORONAVIRUS 












<400> 47 
aattcttggc 


tcatgtggtt 


tatcattagt 


attgtacaaa 


tggcacccgt 


ttctgcaatg 


60 


gttaggatgt 


acatcttctt 


tgettcttte 


tactacatat: 


ggaagagcta 


tgttcatatc 


120 


atggatggtt 


gcacctcttc 


gaettgeatg 


atgtgctata 


agegcaateg 


tgccacacgc 


180 


gttgagtgta 


caactattgt 


taatggcatg 


aagagatctt 


tctatgtcta 


tgcaaatgga 


240 


ggccgtggct 


tetgeaagae 


tcacaattgg 


aattgtctca 


attgtgacac 


attttgeact 


300 
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ggtagtacat 

atcaacccta 

cttcacctct 

tttgtcaatt 

atagtttttg 

tacagtcagc 

ggagatagta 

acttttagtg 

gcaaagggtg 

gttgttgata 

tctgacttag 

gaaaacatga 

gcccaagtag 

ttatctgaac 

agactaactt 

aagggtggta 

gttcttgctg 

ggttacacaa 

atttctactg 

cgtggtggtt 

gagattggtt 

ttcttgcatt 

aaactcattg 

atttttaagg 

ggttctattt 

atcatacagt 

gctgagtact 



tcattagtga 

ctgaccagtc 

actttgacaa 

tagacaattt 

atggcaagtc 

tgatgtgcca 

ctgaagtttc 

ttcctatgga 

tagctttaga 

ccgatgttga 

aagtgacagg 

cgcccagaga 

caaaaagtca 

agctgcgtaa 

gtgctacaac 

agattgttag 

cattggtttg 

atgaaatcat 

atgattgttt 

catacaaaaa 

tcatagtgcc 

ttctacctcg 

agtatagtga 

atgctatggg 

cttatagtga 

ttcctaacac 

gtagacatgg 



tgaagttgct 
atcgtatatt 
ggctggtcaa 
gagagctaac 
caaatgcgac 
acctattctg 
cgttaagatg 
aaaacttaag 
tggtgtcctt 
cacaaaggat 
tgacagttgt 
tcttggcgca 
caatgtttca 
acaaattcgt 
tagacaggtt 
tacttgtttt 
ttatatcgtt 
tggttacaaa 
tgcaaataaa 
tgacaaaagc 
tggcttaccg 
tgtttttagt 
ttttgctacc 
caaacctgtg 
gcttcgtcca 
ttacctggag 
taca 



S226CAS111. 
cgtgatittgt 



ST25 

cactccagtt 



gttgatagtg 

aagacctatg 

aacactaaag 

gagtctgctt 

ttgcttgacc 

tttgatgctt 

gcacttgttg 

tctacattcg 

gttattgaat 

aacaatttca 

tgtatztgact 

ctcatctgga 

agtgctgcca 

gtcaatgtca 

aaacttatgc 

atgccagtac 

gccattcagg 

catgctggtt 

tgccctgtag 

ggtactgtgc 

gctgtztggca 

tctgcttgcg 

ccatattgtt 

gacactcgtt 

ggttctgtta 



ttgctgtgaa 

agagacatcc 

gttcactgcc 

ctaagtctgc 

aagctcttgt 

atgtcgacac 

ctacagctca 

tgtcagctgc 

gtctcaaact 

tgctcaccta 

gtaatgcaag 

atgtaaaaga 

agaagaacaa 

taactactaa 

ttaaggccac 

atacattgtc 

atggtgtcac 

ttgacgcatg 

tagctgctat 

tgagagcaat 

acatttgcta 

ttcttgctgc 

atgacactaa 

atgtgcttat 

gagtagtaac 



taaaagacca 

aaatggcgcg 

gctctcccat 

tattaatgtc 

ttctgtgtac 

atcagacgtt 

cttttcagca 

cagcgagtta 

ccgacaaggt 

ttcacatcac 

taataaggtt 

gcatatcaat 

ctacatgtct 

catacctttt 

aatctcactc 

attattgtgc 

aatccatgat 

tcgtgacatc 

gtttagccag 

cattacaaga 

caatggtgac 

cacaccttcc 

tgagtgtaca 

tttgctagag 

ggatggttcc 

aacttttgat 



360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1884 



<210> 48 

<211> 2020 

<212> DNA 

<213> CORONAVIRUS 



<400> 48 

cactcgttat gtgcttatgg atggttccat catacagttt cctaacactt acctggaggg 
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ttctgttaga gtagtaacaa cttttgatgc tgagtactgt agacatggta catgcgaaag 120 

gtcagaagta ggtatttgcc tatctaccag tggtagatgg gttcttaata atgagcatta 180 

cagagctcta tcaggagttt tctgtggtgt tgatgcgatg aatctcatag ctaacatctt 240 

tactcctctt gtgcaacctg tgggtgcttt agatgtgtct gcttcagtag tggctggtgg 300 

tattattgcc atattggtga cttgtgctgc ctactacttt atgaaattca gacgtgtttt 360 

tggtgagtac aaccatgttg ttgctgctaa tgcacttttg tttttgatgt ctttcactat 420 

actctgtctg gtaccagctt acagctttct gccgggagtc tactcagtct tttacttgta 480 

cttgacattc tatttcacca atgatgtttc attcttggct caccttcaat ggtttgccat 540 

gttttctcct attgtgcctt tttggataac agcaatctat gtattctgta tttctctgaa 600 

gcactgccat tggttcttta acaactatct taggaaaaga gtcatgttta atggagttac 660 

atttagtacc ttcgaggagg ctgctttgtg tacctttttg ctcaacaagg aaatgtacct 720 

aaaattgcgt agcgagacac tgttgccact tacacagtat aacaggtatc ttgctctata 780 

taacaagtac aagtatttca gtggagcctt agatactacc agctatcgtg aagcagcttg 840 

ctgccactta gcaaaggctc taaatgactt tagcaactca ggtgctgatg ttctctacca 900 

accaccacag acatcaatca cttctgctgt tctgcagagt ggttttagga aaatggcatt 960 

cccgtcaggc aaagttgaag ggtgcatggt acaagtaacc tgtggaacta caactcttaa 1020 

tggattgtgg ttggatgaca cagtatactg tccaagacat gtcatttgca cagcagaaga 1080 

catgcttaat cctaactatg aagatctgct cattcgcaaa tccaaccata gctttcttgt 1140 

tcaggctggc aatgttcaac ttcgtgttat tggccattct atgcaaaatt gtctgcttag 1200 

gcttaaagtt gatacttcta accctaagac acccaagtat aaatttgtcc gtatccaacc 1260 

tggtcaaaca ttttcagttc tagcatgcta caatggttca ccatctggtg tttatcagtg 1320 

tgccatgaga cctaatcata ccattaaagg ttctttcctt aatggatcat gtggtagtgt 1380 

tggttttaac attgattatg attgcgtgtc tttctgctat atgcatcata tggagcttcc 1440 

aacaggagta cacgctggta ctgacttaga aggtaaattc tatggtccat ttgttgacag 1500 

acaaactgca caggctgcag gtacagacac aaccataaca ttaaatgttt tggcatggct 1560 

gtatgctgct gttatcaatg gtgataggtg gtttcttaat agattcacca ctactttgaa 1620 

tgactttaac cttgtggcaa tgaagtacaa ctatgaacct ttgacacaag atcatgttga 1680 

catattggga cctctttctg ctcaaacagg aattgccgtc ttagatatgt gtgctgcttt 1740 

gaaagagctg ctgcagaatg gtatgaatgg tcgtactatc cttggtagca ctattttaga 1800 

agatgagttt acaccatttg atgttgttag acaatgctct ggtgttacct tccaaggtaa 1860 

gttcaagaaa attgttaagg gcactcatca ttggatgctt ttaactttct tgacatcact 1920 

attgattctt gttcaaagta cacagtggtc actgtttttc tttgtttacg agaatgcttt 1980 

cttgccattt actcttggta ttatggcaat tgctgcatgt 2020 



<210> 49 
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<211> 2040 

<212> DNA 

<213> CORONAVIRUS 



<400> 49 
agcatttcca 


gcctgaagac 


gtactgtagc 


agctaaactg 


cccagcacca 


tacctctatt 


60 


taggttgttt 


aagcctttga 


tgaagtacaa 


gtatttcact 


ttaggccctt 


ttggtgtgtc 


120 


tgtaacaaac 


ctacaaggtg 


gttccagttc 


tgtgtaaatt 


gtacctgtac 


catcactctt 


180 


agggaatcta 


gcccatttga 


gatcttggtg 


gtctgatagt 


aatgccagca 


caaacctacc 


240 


tcccttcgaa 


ttgttatagt 


aggcaagtgc attgtcatca gtacaagctg 


tttgtgtggt 


300 


accagccgca 


caggacatct 


gtcgtagtgc tactggactc 


agttcattat 


tctgtagttt 


360 


aacagctgag 


ttggctctta 


gagctgtaac 


aataagaggc 


caagccaaat 


ttggtgaatt 


420 


gtccatgtta 


atttcactaa 


gttgaacaat 


cttgctatcc 


gcatcaacaa 


cttgctggat 


480 


ttcccagagt 


gcagatgcat 


atgtaaaggt gttaccatca caagtgttct 


tgtaggtacc 


540 


ataatcaggg 


acaacaacca 


tgagtttggc tgctgtagtc 


aatggtatga 


tgttgagtgg 


600 


aacacaacca 


tcacgcgcat 


tgttgataat gttgttaagt gcatcattat 


caagcttcct 


660 


aagcatagtg 


aagagcattg 


tttgcatagc actagttact tttgccctct 


tgtcctcaga 


720 


tcttgcctgt 


ttgtacattt 


gggtcatagc 


ctgatctgcc 


atcttttrcca 


acttgcgttg 


780 


catggcagca 


tcacggtcaa 


actcagattt 


agccacattc 


aaagatttct 


ttaacttttt 


840 


gagaacgact 


tcagaatcac 


cattagctac agcctgctca taggcctcct 


gggcagtggc 


900 


ataagcggca 


tatgatggta 


aagaactaaa ttctgaagca atagcctgaa 


gagtagcacg 


960 


gttatcgagc 


atttcctcgc 


acaacctatt aatgtctaca gcaccctgca 


tggatagcaa 


1020 


aacagacaaa 


agagaaacca 


tcttctcgaa agcttcagtt 


gtgtcttttg 


caagaagaat 


1080 


atcattgtgg 


agttgtacac 


attgtgccca 


caatttagaa gatgactcta 


ctctaagttg 


1140 


ttgaagaacc 


gagagcagta 


ccacagatgt 


gcactttacg 


tcagacattt 


tagactgtac 


1200 


agtagcaacc 


ttgatacatg 


gtttacctcc 


aatacccaac 


aacttaatgt 


taagcttgaa 


1260 


agcatcaata 


ctactcttag 


gaggcaaaag 


cccctgggag 


ttcatatacc 


taaattcttg 


1320 


tgtagagacc 


aagtagtcat 


aaacaccaag 


agtaagcctg 


aagtaacggt 


tgagtaaaca 


1380 


gaaaaggcca 


aagtagcagc 


agcaacaata 


gcctaagaaa 


caataaacaa 


gcatgataca 


1440 


ctgtaaggtg 


ttgccagtaa 


taaataacaa 


tgggtaatac 


tcaacacaca 


caaacactat 


1500 


agctctagct 


aaaaacatga 


tagtcgtaac 


gacaccagaa 


tagttagagg 


ttacagaaat 


1560 


aactaaggcc 


cacatggaaa 


tagcttgatc 


taaagcatta 


ccatagtraga 


ctttgtaaac 


1620 


aagtgtaatg 


acattcatca 


gtgtccaaac 


acgtctagca 


gcatcatcat 


aaacagtgcg 


1680 


agctgtcatg 


agaataagca 


aaactaaagc 


tgaagcatac 


ataacacaat 


ccttaagcct 


1740 
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aagccatgtc atgatacgca 


tcacccagct 


1800 


agcaggcatg tagaccatat 


taaagtaagc 


aactgttgca 


agagaaggta 


dCdgdddCdd 


J.OOU 


gcacaagaat 


gcgtgcttat 


gcttaacaag 


cagcatagca 


catgcagcaa 


ttgccataat 


1920 


accaagagta aatggcaaga 


aagcattctc 


gtaaacaaag 


aaaaacagtg 


accactgtgt 


1980 


actttgaaca agaatcaata 


gtgatgtcaa 


gaaagttaaa 


agcatccaat 


gatgagtgca 


2040 


<210> 50 














<211> 2012 












<212> DNA 














<213> CORONAVIRUS 












<400> 50 
cttgtaggtt 


tgttacagac 


acaccaaaag 


ggcctaaagt 


gaaatacttg 


tacttcatca 


60 


aaggcttaaa 


caacctaaat 


agaggtatgg 


tgctgggcag 


tttagctgct 


acagtacgtc 


120 


ttcaggctgg 


aaatgctaca 


gaagtacctg 


ccaattcaac tgtgctttcc 


ttctgtgctt 


180 


ttgcagtaga 


ccctgctaaa 


gcatataagg 


attacctagc 


aagtggagga 


caaccaatca 


240 


ccaactgtgt 


gaagatgttg 


tgtacacaca 


ctggtacagg 


acaggcaatt 


actgtaacac 


300 


cagaagctaa 


catggaccaa 


gagtcctttg 


gtggtgcttc 


atgttgtctg 


tattgtagat 


360 


gccacattga 


ccatccaaat 


cctaaaggat 


tctgtgactt gaaaggtaag 


tacgtccaaa 


420 


tacctaccac 


ttgtgctaat 


gacccagtgg 


gttttacact 


tagaaacaca 


gtctgtaccg 


480 


tctgcggaat 


gtggaaaggt 


tatggctgta 


gttgtgacca actccgcgaa 


cccttgatgc 


540 


agtctgcgga 


tgcatcaacg 


tttttaaacg 


ggtttgcggt 


gtaagtgcag 


cccgtcttac 


600 


accgtgcggc 


acaggcacta 


gtactgatgt 


cgtctacagg 


gcttttgata 


tttacaacga 


660 


aaaagttgct 


ggttttgcaa 


agttcctaaa 


aactaattgc tgtcgcttcc 


aggagaagga 


720 


tgaggaaggc 


aatttattag 


actcttactt 


tgtagttaag 


aggcatacta 


tgtctaacta 


780 


ccaacatgaa 


gagactattt 


ataacttggt 


taaagattgt 


ccagcggttg 


ctgtccatga 


840 


ctttttcaag 


tttagagtag 


atggtgacat 


ggtaccacat 


atatcacgtc 


agcgtctaac 


900 


taaatacaca 


atggctgatt 


tagtctatgc 


tctacgtcat 


tttgatgagg 


gtaattgtga 


960 


tacattaaaa 


gaaatactcg 


tcacatacaa 


ttgctgtgat 


gatgattatt 


tcaataagaa 


1020 


ggattggtat 


gacttcgtag 


agaatcctga 


catcttacgc 


gtatatgcta 


acttaggtga 


1080 


gcgtgtacgc 


caatcattat 


taaagactgt 


acaattctgc 


gatgctatgc 


gtgatgcagg 


1140 


cattgtaggc 


gtactgacat 


tagataatca 


ggatcttaat 


gggaactggt 


acgatttcgg 


1200 


tgatttcgta 


caagtagcac 


caggctgcgg 


agttcctatt 


gtggattcat 


attactcatt 


1260 


gctgatgccc 


atcctcactt 


tgactagggc 


attggctgct 


gagtcccata 


tggatgctga 


1320 


tctcgcaaaa 


ccacttatta 


agtgggattt 


gctgaaatat 


gattttacgg 


aagagagact 


1380 
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taccatccca attgtattaa 


144 O 


ctgtttggat 


gataggtgta 


tccttcattg 


tgcaaacttt 


aatgtgttat tttctactgt 


1500 


gtttccacct 


acaagttttg 


gaccactagt 


aagaaaaata 


tttgtagatg gtgttccttt 


1560 


tgttgtttca actggatacc 


attttcgtga 


gttaggagtc 


gtacataatc aggatgtaaa 


162 0 


cttacatagc tcgcgtctca 


gtttcaagga 


acttttagtg 


tatgctgctg atccagctat 


168 0 


gcatgcagct 


tctggcaatt 


tattgctaga 


taaacgcact 


acatgctttt cagtagctgc 


1740 


actaacaaac 


aatgttgctt 


ttcaaactgt 


caaacccggt 


aattttaata aagactttta 


1800 


tgactttgct gtgtctaaag 


gtttctttaa 


ggaaggaagti 


LCXgLLgaaC T.dad.d.L.cll_LL 


100 \J 


cttctttgct 


caggatggca 


acgctgctat 


cagtgattat 


gactattatc gttataatct 


1920 


gccaacaatg 


tgtgatatca 


gacaactcct 


attcgtagtt 


gaagttgttg ataaatactt 


1980 


tgattgttac gatggtggct 


gtattaatgc 


ca 




2012 


<210> 51 












<211> 1877 










<212> DNA 












<213> CORONAVIRUS 










<400> 51 
gtacttcgcg 


tacagtggca 


ataccatatg 


acagcttaaa tgtttcctca gtggctttga 


60 


gcgtttctgc 


tgcgaaaagc 


ttgagtctct 


cagtacaagt 


gttggcaagt atgtaatcgc 


120 


cagcattagt 


ccaatcacat 


gttgctatcg 


cattgaagtc agtgacattg tcactgccta 


180 


cacatgtgtt 


tttgtataaa 


ccaaaaacct 


gaccattagc 


acataatgga aaactaatgg 


240 


gaggcttatg 


tgacttgcaa 


taatagctca 


tacctcctag 


atacagttgt gtcacatcag 


300 


tgacatcaca 


acctggggca 


ttgcaaacat 


agggattaac 


agacaacact aatttgtgtg 


360 


atgttgaaat 


gacatggtca 


tagcagcact 


tgcaacatag 


gaatggtctc ctaatacagg 


420 


caccgcaacg 


aagtgaagtc 


tgtgaattgc 


acaatacaca 


agcacctaca gcctgcaaga 


480 


ctgtatgtgg 


tgtgtacata 


gcctcataaa 


actcaggttc 


ccagtaccgt gaggtgttat 


540 


cattagttag 


cattacggaa 


tacatgtcca 


acatgtggcc agtaagctca tcatgtaact 


600 


ttctaatgta 


ttgtaaatac 


aagtgaaaga 


catcagcata 


ctcctgatta ggatgttttg 


660 


taagtgggta 


agcatcaata 


gccagtgaca 


cgaacctttc 


aatcataagt gtaccatctg 


720 


ttttgacaat 


atcatcgaca 


aaacagcctg 


cgcctaatat 


tcttgatgga tctgggtaag 


780 


gcaggtacac 


gtaatcatct 


ccttgtttaa 


ctagcattgt 


atgctgtgag caaaattcgt 


840 


gaggtccttt 


agtaaggtca 


gtctcagtcc 


aacattttgc 


ctcagacatg aacacattat 


900 


tttgataata 


aagaactgcc 


ttaaagttct 


taatgctagc 


tactaaacct tgagccgcat 


960 


agttactgtt 


atagcacaca 


acggcatcat 


cagaaagaat 


catcatggag aaatgtttac 


1020 
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gcaggtaagc gtaaaactca tccacgaatt catgatcaac atccctattt ctatagagac 1080 

actcatagag cctgtgttgt agattgcgga catacttgtc agctatctta ttaccatcag 1140 

ttgaaagaag tgcatttaca ttggctgtaa cagcttgaca aatgttaaag acactattag 1200 

cataagcagt tgtagcatca ccggatgatg ttccacctgg tttaacatat agtgagccgc 1260 

cacacatgac catctcactt aatacttgcg cacactcgtt agctaacctg tagaaacggt 1320 

gtgataagtt acagcaagtg ttatgtttgc gagcaagaac aagagaggcc attatcctaa 1380 

gcatgttagg catggctctg tcacattttg gataatccca acccataagg tgtggagttt 1440 

ctacatcact gtaaacagtt tttaacatat tatgccagcc accgtaaaac ttgcttgttc 1500 

caattaccac agtagctcct ctagtggcgg ctattgactt caataatttc tgatgaaact 1560 

gtctatttgt catagtacta cagatagaga caccagctac ggtgcgagct ctattctttg 1620 

cactaatggc atacttaaga ttcatttgag ttatagtagg gatgacatta cgcttagtat 1680 

acgcgaaaag tgcatcttga tcctcataac tcattgagtc ataataaagt ctagccttac 1740 

cccatttatt aaatgggaaa ccagctgatt tatccagatt gttaacgatt acttggttgg 1800 

cattaataca gccaccatcg taacaatcaa agtatttatc aacaacttca actacgaata 1860 

ggagttgtct gatatca 1877 

<210> 52 

<211> 2051 

<212> DNA 

<213> CORONAVIRUS 



<400> 52 
tcaggtccaa 


tcttgacaaa 


gtacttcatt 


gatgtaagct 


caaagccatg 


cgcccaaagg 


60 


acgaacacga 


ctctgtctga 


caatcctttc 


agtgtatcac tgagcatttg 


tactatctta 


120 


atacgcacta 


cattccaggg 


caagccttta 


tacatgagtg 


gtataagatg 


tttaaactgg 


180 


tcacctggtg 


gaggttttgc 


attaactctg 


gtgaattctg 


tgttattttc 


agtgtcaaca 


240 


taaccagtcg 


gtacagctac taagttaaca 


cctgtagaaa atcctagctg 


gagaggtagg 


300 


ttagtaccca 


cagcatctct 


agttgcatga 


cagccctcta 


catcaaagcc 


aatccacgca 


360 


cgaacgtgac 


gaatagcttc 


ttcgcgggtg 


ataaacatat 


tagggtaacc 


attgacttgg 


420 


taattcattt 


tgaaacccat 


catagagatg 


agtctacggt 


aggtcatgtc 


ctttggtatg 


480 


cctggtatgt 


caacacataa 


tccttcagtc 


ttgaacttta tatcaacgct 


gaggtgtgta 


540 


ggtgcctgtg 


taggatgaag 


accagtaatg 


atcttactac 


agtccttaaa 


aagtccagtt 


600 


acattttctg 


cttgtaatgt 


agccacattg 


cgacgtggta 


tttctagact 


tgtaaattgc 


660 


agtttgtcat 


aaagatctct 


atcagacatt 


atgcacaaaa 


tgccaatttt 


tgcccttgtg 


720 


atagccacat 


tgaagcggtt 


gacattacaa 


gagtgtgctg 


tttcagtagt 


ttgtgtgaat 


780 
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accctgtgat gaatcaacag tctgcgtagg 


caatcctaag 


O A f\ 

840 


atttttgaag 


ctacagcgtt 


ctgtgaatta taaggtgaga taaaaacagc 


ttttctccaa 


900 


gcaggattgc 


gtgtaagaaa 


ttctcttaca acgcctattt gaggtctgtt 


gattgcagat 


960 


gaaacatcat 


gtgtaataac 


acctttgtag aacattttga agcattgagc 


tgacttatcc 


•i ATA 

1020 


ttgtgtgctt 


ttagcttatt 


gtcataaact aaagcactca cagtgtcaac 


aatttcagca 


1080 


ggacaacggc 


gacaagttcc 


aaggaacatg tctggaccta ttgttttcat aagtctgcac 


1 "1 A C\ 

1140 


actgaattaa 


aatattctgg 


ttctagtgtg cctttagtca gcaatgtgcg 


gggggctggt 


1200 


aattgagcag 


gatcgccaat 


atagacgtag tgttttgcac gaagtctagc 


attgacaaca 


1260 


ctcaagtcat 


aattagtagc 


catagagatt tcatcaaaga ctacaatgtc 


agcagttgtt 


1320 


tctggcaatg 


catttacagt 


gcagaaaaca tactgttcta gtgttgaatt 


cactttgaat 


1380 


ttatcaaaac 


actctacgcg 


cgcacgcgca ggtatgattc tactacattt 


atctatgggc 


1440 


aaatatttta 


atgccttttc 


acatagggca tcaacagctg catgagagca 


tgccgtatac 


1500 


actatgcgag 


cagatgggta 


atagagagca agtccgatgg caaaatgact 


cttaccagta 


1560 


ccaggtggtc 


cttggagtgt 


agagtacttt tgcatgccga ccttttgata 


atttgcaaca 


1620 


ttgctagaaa 


actcatctga 


gatgttgagt gttgggtaca agccagtaat tctcacatag 


1680 


tgctcttgtg 


gcactagagt 


aggtgcacta agtggcatta cagtgtgaga tgtcaacaca 


•i *7 a n 

1740 


aagtaatcac 


caacattcaa 


cttgtatgtc gtagtacctc tgtacacaac 


agcatcacca 


1800 


tagtcacctt 


tttcaaaggt 


gtactctcca atctgtactt tactattttt 


agttacacgg 


1860 


taarrantaa 

V. Cl Cv v. v_ ci y l_CLCL 


aaacataatt 


tctgttcaat ggtggtctag gttttccaac 


ctcccatgaa 


1920 


agatgcaatt 


ctctgtcaga 


gagtacttcg cgtacagtgg caataccata 


tgacagctta 


1980 


aatgtttcct 


cagtggcttt 


gagcgtttct gctgcgaaaa gcttgagtct 


ctcagtacaa 


2040 


gtgttggcaa 


g 






2051 


<210> 53 










<211> 2075 








<212> DNA 










<213> CORONAVIRUS 








<400> 53 

tgcttgtagt tttgggtaga 


aggtttcaac atgtccatcc ttacaccaaa gcatgaatga 


60 


aatttcagca tagtcaattg 


taaccttgac cacttttgaa atcactgaca aatcttgtga 


120 


ctttattatc 


tcgacaaagt 


catcaagtaa aagatcaatc acagaacaca 


cacattttga 


180 


tgaacctgtt 


tgcgcatctg 


ttatgaagta atttttcact gtgctgtcca 


tagggataaa 


240 


atcctctaat 


ttaagtggtg 


aatcttgtga gcgcttggct aagcctatca 


ttaaatgaag 


300 


accgccaagt tgtccatgac 


tgaaatctcc ataaacgatg tgttcgaagg 


catagccctc 


360 



page 81 



WO 2005/056781 



PCT/FR2004/003105 



S226CAS111.ST25 

gagcttatat cgctgtatga attcatccat agcgagctcg agaaagtcag tttccatttg 420 

tgatctgggc ttaaaatcct ctaagtctct gctctgagta aagtaggttt caggcaactg 480 

ttgaataatg ccgtctactt tcttaaagta gttaaactgt gtttttactg attctccaat 540 

taatgtgact ccattgacgc tagcttgtgc tggtcccttt gaaggtgtta gacctttgac 600 

tgaaccttct gttattaaaa caccattacg ggcgtttcta aaaaggtcta cctgtccttc 660 

cactctacca tcaaacaaga cagtaagtga agaacaagca ctctcagtag gtttcttggc 720 

aatgtcagtc attgtgcaga cacctattgt agatacatgt gctggggctt ctcttttgta 780 

gtcccagatt acagtattag cagcgatatc aacacccaaa ttattgagta tcttaatctc 840 

tggcactggt ttaatgttac gcttagccca aagctcaaat gcaacattaa caggaagtgt 900 

tgtcttattt tcaaagatct ccacatcaat accatctacc tttgtgtaaa cagcattatt 960 

aatgatggaa acaggtgctt cgccggcgtg tccatcaaag tgtcctttat taacaacatt 1020 

ataagccaca ttttctaaac tctgtaacct ggtaaatgta ttccacaggt tataagtatc 1080 

aaattgtttg taaatccata ggctaaatcc agcagaaatc atcatattat atgcatccaa 1140 

gtactgtcgg tactcatttg catggtgtct gcaaacagca ccacctaaat tgcatcgtgt 1200 

aatacacgta gcagatttga gtggaacata atcaatatcc gacactactt gtttgccatg 1260 

agactcacaa ggactatcag aatagtaaaa gaaaggcaat tgctttaaat tagtaaatgc 1320 

acttttatcg aaagctggag tgtggaatgc atgcttattc acatacaaac taccaccatc 1380 

acagcctggt aagttcaagt ttgacaagac tcttgtgtca aacctacaca caattgcatt 1440 

ggctgggtaa cgatcaacgt tacaattcca aaacaaacaa acaccatcag tgaatttatc 1500 

gtgatgtgta gcataagaat agaagagttc ctctattttg taagctttgt cactacatgg 1560 

ctgagcatcg tagaacttcc attctacttc agcctgaggc acacacttga tagcctttgg 1620 

atttccaatg tcatgaagaa ctggaaactt atcagcaagc aatgcagact tcacaaccat 1680 

gtgttgtact tttctgcaag cagaattaac cctcagttca tctcctataa tagggtattc 1740 

aacagaccaa tcaacgcgct taacaaagca ctcatggact gctaaacatc tagtcatgat 1800 

agcatcacaa ctagccacat gtgcatttcc atgtacctgg caatgttggt catggttact 1860 

ctgaaggtta cccgtaaagc cccactgctg aacatcaatc ataaatgggt tatagacata 1920 

gtcaaaaccc acagaatgat tccagcaggc ataagtatct gatgaagtag aaaagcaagt 1980 

tgcacgtttg tcacacagac aacacgttct ttcaggtcca atcttgacaa agtacttcat 2040 

tgatgtaagc tcaaagccat gcgcccaaag gacga 2075 

<210> 54 

<211> 1891 

<212> DNA 

<213> CORONAVIRUS 
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<400> 54 
aagattcacc 


acttaaatta 


gaggatttta 


tccctatgga 


cagcacagtg 


aaaaattact 


60 


tcataacaga 


tgcgcaaaca 


ggttcatcaa 


aatgtgtgtg 


ttctgtgatt 


gatcttttac 


120 


ttgatgactt 


tgtcgagata 


ataaagtcac 


aagatttgtc 


agtgatttca 


aaagtggtca 


180 


aggttacaat 


tgactatgct 


gaaatttcat 


tcatgctttg 


gtgtaaggat 


ggacatgttg 


240 


aaaccttcta 


cccaaaacta 


caagcaagtc 


aagcgtggca 


accaggtgtt 


gcgatgccta 


300 


acttgtacaa 


gatgcaaaga 


atgcttcttg 


aaaagtgtga 


ccttcagaat 


tatggtgaaa 


360 


atgctgttat 


accaaaagga 


ataatgatga 


atgtcgcaaa 


gtatactcaa 


ctgtgtcaat 


420 


acttaaatac 


acttacttta 


gctgtaccct 


acaacatgag 


agttattcac 


tttggtgctg 


480 


gctctgataa 


aggagttgca 


ccaggtacag 


ctgtgctcag 


acaatggttg 


ccaactggca 


540 


cactacttgt 


cgattcagat 


cttaatgact 


tcgtctccga 


cgcagattct 


actttaattg 


600 


gagactgtgc 


aacagtacat 


acggctaata 


aatgggacct 


tattattagc 


gatatgtatg 


660 


accctaggac 


caaacatgtg 


acaaaagaga 


atgactctaa agaagggttt 


ttcacttatc 


720 


tgtgtggatt 


tataaagcaa 


aaactagccc 


tgggtggttc tatagctgta 


aagataacag 


780 


agcattcttg 


gaatgctgac 


ctttacaagc 


ttatgggcca tttctcatgg 


tggacagctt 


840 


ttgttacaaa 


tgtaaatgca 


tcatcatcgg 


aagcattttt 


aattggggct 


aactatcttg 


900 


gcaagccgaa 


ggaacaaatt 


gatggctata 


ccatgcatgc 


taactacatt 


ttctggagga 


960 


acacaaatcc 


tatccagttg 


tcttcctatt 


cactctttga 


catgagcaaa 


tttcctctta 


1020 


aattaagagg 


aactgctgta 


atgtctctta 


aggagaatca 


aatcaatgat 


atgatttatt 


1080 


ctcttctgga 


aaaaggtagg 


cttatcatta 


gagaaaacaa 


cagagttgtg 


gtttcaagtg 


1140 


atattcttgt 


taacaactaa 


acgaacatgt 


ttattttctt 


attatttctt 


actctcacta 


1200 


gtggtagtga 


ccttgaccgg 


tgcaccactt 


ttgatgatgt 


tcaagctcct 


aattacactc 


1260 


aacatacttc 


atctatgagg 


ggggtttact 


atcctgatga 


aatttttaga 


tcagacactc 


1320 


tttatttaac 


tcaggattta 


tttcttccat 


tttattctaa tgttacaggg 


tttcatacta 


1380 


ttaatcatac 


gtttggcaac 


cctgtcatac 


cttttaagga tggtatttat 


tttgctgcca 


1440 


cagagaaatc 


aaatgttgtc 


cgtggttggg 


tttttggttc 


taccatgaac 


aacaagtcac 


1500 


agtcggtgat 


tattattaac 


aattctacta 


atgttgttat 


acgagcatgt 


aactttgaat 


1560 


tgtgtgacaa 


ccctttcttt 


gctgtttcta 


aacccatggg 


tacacagaca 


catactatga 


1620 


tattcgataa 


tgcatttaat 


tgcactttcg 


agtacatatc 


tgatgccttt 


tcgcttgatg 


1680 


tttcagaaaa 


gtcaggtaat 


tttaaacact 


tacgagagtt 


tgtgtttaaa 


aataaagatg 


1740 


ggtttctcta 


tgtttataag 


ggctatcaac 


ctatagatgt 


agttcgtgat 


ctaccttctg 


1800 


gttttaacac 


tttgaaacct 


atttttaagt 


tgcctcttgg 


tattaacatt 


acaaatttta 


1860 


gagccattct 


tacagccttt 


tcacctgctc 


a 






1891 



<210> 55 
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<211> 32 
<212> DNA 

<213> ARTIFICIAL SEQUENCE 
<220> 

<223> amorce N sens 
<400> 55 

cccatatgtc tgataatgga ccccaatcaa ac 

<210> 56 

<2U> 32 

<212> DNA 

<213> artificial sequence 
<220> 

<223> amorce N antisens 

<400> 56 

cccccgggtg cctgagttga atcagcagaa gc 

<210> 57 

<211> 31 

<212> DNA 

<213> artificial sequence 
<220> 

<223> amorce Sc sens 

<400> 57 

cccatatgag tgaccttgac cggtgcacca c 

<210> 58 

<211> 30 

<212> DNA 

<213> artificial sequence 
<220> 

<223> amorce SL sens 

<400> 58 
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cccatatgaa accttgcacc ccacctgctc 30 



<210> 59 

<211> 33 

<212> DNA 

<213> amorce Sc et SL antisens 

<400> 59 

cccccgggtt taatatattg ctcatatttt ccc 

<210> 60 

<211> 16 

<212> DNA 

<213> amorce sens serie 1 



33 



<400> 60 
ggcatcgtat gggttg 

<210> 61 

<211> 16 

<212> DNA 

<213> amorce antisens serie 2 (28774-28759) 

<400> 61 
cagtttcacc acctcc 

<210> 62 

<211> 16 

<212> DNA 

<213> amorce sens serie 2 (28375-28390) 

<400> 62 
ggctactacc gaagag 

<210> 63 
<211> 16 
<212> DNA 

<213> amorce antisens serie 2 (28702-28687) 
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<400> 63 

aattaccgcg actacg 16 

<210> 64 
<211> 26 
<212> DNA 

<213> sonde 1/serie 1 (28561-28586) 
<400> 64 

ggcacccgca atcctaataa caatgc 26 

<210> 65 
<211> 21 
<212> DNA 

<213> sonde 2/serie 1 (28588-28608) 
<400> 65 

gccaccgtgc tacaacttcc t 21 

<210> 66 
<211> 23 
<212> DNA 

<213> sonde 1/serie 2 /sonde N/FL (28541-28563) 
<400> 66 

atacacccaa agaccacatt ggc 23 

<210> 67 

<211> 25 

<212> DNA 

<213> sonde 2/serie 2/sonde SARS/N/LC705 (28565-28589) 



<400> 67 

cccgcaatcc taataacaat gctgc 25 

<210> 68 
<211> 30 
<212> DNA 

<213> artificial sequence 
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<220> 

<223> amorce ancre 14T 

<400> 68 

agatgaattc ggtacctttt tttttttttt 

<210> 69 

<211> 13 

<212> PRT 

<213> artificial sequence 



<220> 

<223> peptide M2-14 
<400> 69 

Ala Asp Asn Gly Thr He Thr val Glu Glu Leu Lys Gin 
15 10 

<210> 70 
<211> 12 
<212> PRT 

<213> artificial sequence 
<220> 

<223> peptide El-12 
<400> 70 

Met Tyr ser Phe val ser Glu Glu Thr Gly Thr Leu 
15 10 

<210> 71 

<211> 24 

<212> PRT 

<213> artificial sequence 



<220> 

<223> peptide E53-72 
<400> 71 

Lys Pro Thr val Tyr val Tyr Ser Arg val Lys Asn Leu Asn ser ser 
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10 15 



Glu Gly Val Pro Asp Leu Leu Val 
20 



<210> 72 

<211> 153 

<212> DNA 

<213> CORONAVIRUS 



<400> 72 

gatattaggt ttttacctac ccaggaaaag ccaaccaacc tcgatctctt gtagatctgt 60 

tctctaaacg aactttaaaa tctgtgtagc tgtcgctcgg ctgcatgcct agtgcaccta 120 

cgcagtataa acaataataa attttactgt cgt 153 

<210> 73 

<211> 410 

<212> DNA 

<213> CORONAVIRUS 



<400> 73 

ttctccagac aacttcaaaa 


ttccatgagt 


ggagcttctg 


ctgattcaac 


tcaggcataa 


60 


acactcatga tgaccacaca 


aggcagatgg 


gctatgtaaa 


cgttttcgca 


attccgttta 


120 


cgatacatag tctactcttg 


tgcagaatga 


attctcgtaa 


ctaaacagca 


caagtaggtt 


180 


tagttaactt taatctcaca 


tagcaatctt 


taatcaatgt 


gtaacattag 


ggaggacttg 


240 


aaagagccac cacattttca 


tcgaggccac 


gcggagtacg 


atcgagggta 


cagtgaataa 


300 


tgctagggag agctgcctat 


atggaagagc 


cctaatgtgt 


aaaattaatt 


ttagtagtgc 


360 


tatccccatg tgattttaat 


agcttcttag 


gagaatgaca 


aaaaaaaaaa 




410 



<210> 74 

<211> 4382 

<212> PRT 

<213> CORONAVIRUS 



<400> 74 

Met Glu ser Leu val Leu Gly Val 
1 5 



Asn Glu Lys Thr His val Gin Leu 
10 15 



Ser Leu Pro val Leu Gin Val Arg Asp Val Leu val Arg Gly Phe Gly 
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20 25 30 

Asp Ser Val Glu Glu Ala Leu ser Glu Ala Arg Glu His Leu Lys Asn 
35 40 45 

Gly Thr Cys Gly Leu Val Glu Leu Glu Lys Gly val Leu Pro Gin Leu 
50 55 60 

Glu Gin Pro Tyr Val Phe He Lys Arg Ser Asp Ala Leu ser Thr Asn 
65 70 75 80 

His Gly His Lys val val Glu Leu Val Ala Glu Met Asp Gly lie Gin 
85 90 95 

Tyr Gly Arg ser Gly lie Thr Leu Gly Val Leu val Pro His val Gly 
100 105 HO 

Glu Thr Pro lie Ala Tyr Arg Asn Val Leu Leu Arg Lys Asn Gly Asn 
115 120 125 

Lys Gly Ala Gly Gly His ser Tyr Gly He Asp Leu Lys Ser Tyr Asp 
130 135 140 

Leu Gly Asp Glu Leu Gly Thr Asp Pro lie Glu Asp Tyr Glu Gin Asn 
145 150 155 160 

Trp Asn Thr Lys His Gly ser Gly Ala Leu Arg Glu Leu Thr Arg Glu 
165 170 175 

Leu Asn Gly Gly Ala val Thr Arg Tyr Val Asp Asn Asn Phe cys Gly 
180 185 190 

pro Asp Gly Tyr Pro Leu Asp cys lie Lys Asp Phe Leu Ala Arg Ala 
195 200 205 

Gly Lys Ser Met Cys Thr Leu Ser Glu Gin Leu Asp Tyr lie Glu Ser 
210 215 220 

Lys Arg Gly val Tyr Cys cys Arg Asp His Glu His Glu lie Ala Trp 
225 " " 230 235 240 

Phe Thr Glu Arg ser Asp Lys ser Tyr Glu His Gin Thr Pro Phe Glu 
245 250 255 

lie Lys ser Ala Lys Lys Phe Asp Thr Phe Lys Gly Glu cys Pro Lys 
260 265 270 

Phe Val Phe Pro Leu Asn Ser Lys Val Lys val lie Gin Pro Arg val 
275 280 285 

Glu Lys Lys Lys Thr Glu Gly Phe Met Gly Arg lie Arg ser val Tyr 
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290 295 300 

pro Val Ala ser Pro Gin Glu Cys Asn Asn Met His Leu ser Thr Leu 
305 310 315 320 

Met Lys cys Asn His cys Asp Glu val Ser Trp Gin Thr cys Asp Phe 
325 330 335 

Leu Lys Ala Thr Cys Glu His cys Gly Thr Glu Asn Leu val lie Glu 
340 345 350 

Gly Pro Thr Thr Cys Gly Tyr Leu pro Thr Asn Ala Val Val Lys Met 
355 360 365 

pro cys Pro Ala cys Gin Asp Pro Glu lie Gly Pro Glu His ser val 
370 375 380 

Ala Asp Tyr His Asn His Ser Asn He Glu Thr Arg Leu Arg Lys Gly 
385 390 395 400 

Gly Arg Thr Arg cys Phe Gly Gly Cys val Phe Ala Tyr val Gly Cys 
405 410 415 

Tyr Asn Lys Arg Ala Tyr Trp val Pro Arg Ala Ser Ala Asp lie Gly 
420 425 430 

Ser Gly His Thr Gly lie Thr Gly Asp Asn val Glu Thr Leu Asn Glu 
435 440 445 

Asp Leu Leu Glu lie Leu ser Arg Glu Arg Val Asn lie Asn lie val 
450 455 460 

Gly Asp Phe His Leu Asn Glu Glu val Ala lie lie Leu Ala Ser Phe 
465 470 475 480 

ser Ala Ser Thr Ser Ala Phe He Asp Thr lie Lys Ser Leu Asp Tyr 
485 490 495 

Lys Ser Phe Lys Thr lie val Glu Ser Cys Gly Asn Tyr Lys val Thr 
500 505 510 

Lys Gly Lys Pro val Lys Gly Ala Trp Asn lie Gly Gin Gin Arg ser 
515 520 525 

Val Leu Thr Pro Leu cys Gly Phe Pro ser Gin Ala Ala Gly Val lie 
530 535 540 

Arg ser lie Phe Ala Arg Thr Leu Asp Ala Ala Asn His Ser lie Pro 
545 550 555 560 

Asp Leu Gin Arg Ala Ala val Thr lie Leu Asp Gly lie Ser Glu Gin 
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565 570 575 

ser Leu Arg Leu val Asp Ala Met val Tyr Thr Ser Asp Leu Leu Thr 
580 585 590 

Asn Ser val lie lie Met Ala Tyr Val Thr Gly Gly Leu val Gin Gin 
595 600 605 

Thr Ser Gin Trp Leu ser Asn Leu Leu Gly Thr Thr val Glu Lys Leu 
610 615 620 

Arg Pro lie Phe Glu Trp lie Glu Ala Lys Leu ser Ala Gly val Glu 
625 630 635 640 

Phe Leu Lys Asp Ala Trp Glu lie Leu Lys Phe Leu lie Thr Gly Val 
645 650 655 

Phe Asp lie Val Lys Gly Gin lie Gin Val Ala ser Asp Asn lie Lys 
660 665 670 

Asp Cys Val Lys cys Phe lie Asp val val Asn Lys Ala Leu Glu Met 
675 680 685 

cys He Asp Gin val Thr lie Ala Gly Ala Lys Leu Arg Ser Leu Asn 
690 695 700 

Leu Gly Glu val Phe lie Ala Gin Ser Lys Gly Leu Tyr Arg Gin cys 
705 710 715 720 

lie Arg Gly Lys Glu Gin Leu Gin Leu Leu Met Pro Leu Lys Ala Pro 
725 730 735 

Lys Glu val Thr Phe Leu Glu Gly Asp ser His Asp Thr val Leu Thr 
740 745 750 

ser Glu Glu val Val Leu Lys Asn Gly Glu Leu Glu Ala Leu Glu Thr 
755 760 765 

pro val Asp Ser Phe Thr Asn Gly Ala He val Gly Thr Pro Val cys 
770 775 780 

Val Asn Gly Leu Met Leu Leu Glu lie Lys Asp Lys Glu Gin Tyr Cys 
785 790 795 800 

Ala Leu ser Pro Gly Leu Leu Ala Thr Asn Asn Val Phe Arg Leu Lys 
805 810 815 

Gly Gly Ala Pro He Lys Gly val Thr Phe Gly Glu Asp Thr Val Trp 
y J 820 825 830 

Glu val Gin Gly Tyr Lys Asn val Arg lie Thr Phe Glu Leu Asp Glu 
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835 840 845 

Arg val Asp Lys val Leu Asn Glu Lys cys ser Val Tyr Thr Val Glu 
850 855 860 

Ser Gly Thr Glu Val Thr Glu Phe Ala cys val val Ala Glu Ala val 
865 870 875 880 

val Lys Thr Leu Gin Pro val ser Asp Leu Leu Thr Asn Met Gly lie 
885 890 895 

Asp Leu Asp Glu Trp Ser Val Ala Thr Phe Tyr Leu Phe Asp Asp Ala 
900 905 910 

Gly Glu Glu Asn Phe ser Ser Arg Met Tyr Cys Ser Phe Tyr Pro Pro 
915 920 925 

ASP GlU GlU Glu Glu Asp Asp Ala Glu Cys Gl U Gl U Glu Gl U lie Asp 
930 935 940 

Glu Thr cys Glu His Glu Tyr Gly Thr Glu Asp Asp Tyr Gin Gly Leu 
945 950 955 960 

Pro Leu Glu Phe Gly Ala Ser Ala Glu Thr Val Arg val Glu Glu Glu 
965 970 975 

Glu Glu Glu Asp Trp Leu Asp Asp Thr Thr Glu Gin Ser Glu He Glu 
980 985 990 

pro Glu Pro Glu Pro Thr Pro Glu Glu Pro val Asn Gin Phe Thr Gly 
995 1000 1005 

Tyr Leu Lys Leu Thr Asp Asn val Ala lie Lys Cys Val Asp lie 
1010 1015 1020 

val Lys Glu Ala Gin ser Ala Asn pro Met val lie Val Asn Ala 
1025 1030 1035 

Ala Asn He His Leu Lys His Gly Gly Gly val Ala Gly Ala Leu 
1040 1045 1050 

Asn Lys Ala Thr Asn Gly Ala Met Gin Lys Glu Ser Asp Asp Tyr 
1055 1060 1065 

lie Lys Leu Asn Gly Pro Leu Thr val Gly Gly Ser Cys Leu Leu 
1070 1075 1080 

ser Gly His Asn Leu Ala Lys Lys Cys Leu His Val Val Gly Pro 
1085 1090 1095 

Asn Leu Asn Ala Gly Glu Asp lie Gin Leu Leu Lys Ala Ala Tyr 
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1100 1105 1110 

Glu Asn Phe Asn Ser Gin Asp He Leu Leu Ala Pro Leu Leu ser 
1115 1120 1125 

Ala Gly lie Phe Gly Ala Lys Pro Leu Gin Ser Leu Gin Val Cys 
1130 1135 1140 

val Gin Thr val Arg Thr Gin val Tyr lie Ala Val Asn Asp Lys 
1145 1150 1155 

Ala Leu Tyr Glu Gin Val val Met Asp Tyr Leu Asp Asn Leu Lys 
1160 1165 1170 

Pro Arg Val Glu Ala Pro Lys Gin Glu Glu Pro Pro Asn Thr Glu 
1175 1180 1185 

Asp ser Lys Thr Glu Glu Lys ser val val Gin Lys Pro Val Asp 
1190 1195 1200 

Val Lys Pro Lys lie Lys Ala Cys lie Asp Glu val Thr Thr Thr 
1205 1210 1215 

Leu Glu Glu Thr Lys Phe Leu Thr Asn Lys Leu Leu Leu Phe Ala 
1220 1225 1230 

Asp lie Asn Gly Lys Leu Tyr His Asp ser Gin Asn Met Leu Arg 
1235 1240 1245 

Gly Glu Asp Met Ser Phe Leu Glu Lys Asp Ala Pro Tyr Met val 
1250 1255 " 1260 

Gly Asp val lie Thr ser Gly Asp lie Thr cys Val val lie Pro 
1265 1270 1275 

Ser Lys Lys Ala Gly Gly Thr Thr Glu Met Leu Ser Arg Ala Leu 
1280 1285 1290 

Lys Lys val Pro Val Asp Glu Tyr lie Thr Thr Tyr Pro Gly Gin 
1295 1300 1305 

Gly cys Ala Gly Tyr Thr Leu Glu Glu Ala Lys Thr Ala Leu Lys 
1310 1315 1320 

Lys cys Lys ser Ala Phe Tyr Val Leu Pro Ser Glu Ala Pro Asn 
1325 1330 1335 

Ala Lys Glu Glu He Leu Gly Thr Val Ser Trp Asn Leu Arg Glu 
1340 1345 1350 

Met Leu Ala His Ala Glu Glu Thr Arg Lys Leu Met Pro lie Cys 
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1355 1360 1365 

Met Asp val Arg Ala He Met Ala Thr He Gin Arg Lys Tyr Lys 
1370 1375 1380 

Gly He Lys He G"ln Glu Gly He val Asp Tyr Gly Val Arg Phe 
1385 1390 1395 

Phe Phe Tyr Thr ser Lys Glu Pro val Ala Ser lie lie Thr Lys 
1400 1405 1410 

Leu Asn Ser Leu Asn Glu Pro Leu val Thr Met Pro lie Gly Tyr 
1415 1420 1425 

Val Thr His Gly Phe Asn Leu Glu Glu Ala Ala Arg Cys Met Arg 
1430 1435 1440 

ser Leu Lys Ala Pro Ala val val Ser Val ser ser Pro Asp Ala 
1445 1450 1455 

Val Thr Thr Tyr Asn Gly Tyr Leu Thr Ser ser ser Lys Thr Ser 
1460 1465 1470 

Glu Glu His Phe val Glu Thr val Ser Leu Ala Gly ser Tyr Arg 
1475 1480 1485 

asd Trp Ser Tyr Ser Gly Gin Arg Thr Glu Leu Gly val Glu Phe 
K 1490 1495 1500 

Leu Lys Arg Gly Asp Lys lie Val Tyr His Thr Leu Glu ser Pro 
1505 " 1510 1515 

Val Glu Phe His Leu Asp Gly Glu Val Leu Ser Leu Asp Lys Leu 
1520 1525 1530 

Lys ser Leu Leu ser Leu Arg Glu Val Lys Thr lie Lys val Phe 
1535 1540 1545 

Thr Thr Val Asp Asn Thr Asn Leu His Thr Gin Leu val Asp Met 
1550 1555 1560 

ser Met Thr Tyr Gly Gin Gin Phe Gly Pro Thr Tyr Leu Asp Gly 
1565 1570 1575 

Ala Asp val Thr Lys He Lys Pro His val Asn His Glu Gly Lys 
1580 1585 1590 

Thr Phe Phe val Leu Pro ser Asp Asp Thr Leu Arg Ser Glu Ala 
1595 1600 1605 

Phe Glu Tyr Tyr His Thr Leu Asp Glu Ser Phe Leu Gly Arg Tyr 
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1610 1615 1620 

Met ser Ala Leu Asn His Thr Lys Lys Trp Lys Phe Pro Gin Val 
1625 1630 1635 

Gly Gly Leu Thr Ser lie Lys Trp Ala Asp Asn Asn Cys Tyr Leu 
1640 1645 1650 

ser Ser val Leu Leu Ala Leu Gin Gin Leu Glu val Lys Phe Asn 
1655 1660 1665 

AT a Pro Ala Leu Gin Glu Ala Tyr Tyr Arg Ala Arg Ala Gly Asp 
1670 1675 1680 

Ala Ala Asn Phe Cys Ala Leu He Leu Ala Tyr Ser Asn Lys Thr 
1685 1690 1695 

val Gly Glu Leu Gly Asp Val Arg Glu Thr Met Thr His Leu Leu 
1700 1705 1710 

Gin His Ala Asn Leu Glu ser Ala Lys Arg val Leu Asn val Val 
1715 1720 1725 

cys Lys His cys Gly Gin Lys Thr Thr Thr Leu Thr Gly val Glu 
1730 1735 1740 

Ala Val Met Tyr Met Gly Thr Leu Ser Tyr Asp Asn Leu Lys Thr 
1745 1750 1755 

Gly val Ser lie Pro cys val Cys Gly Arg Asp Ala Thr Gin Tyr 
1760 1765 1770 

i_eu val Gin Gin Glu Ser ser Phe Val Met Met Ser Ala Pro Pro 
1775 1780 1785 

Ala Glu Tyr Lys Leu Gin Gin Gly Thr Phe Leu Cys Ala Asn Glu 
1790 1795 1800 

Tyr Thr Gly Asn Tyr Gin Cys Gly His Tyr Thr His lie Thr Ala 
1805 1810 1815 

Lys Glu Thr Leu Tyr Arg lie Asp Gly Ala His Leu Thr Lys Met 
1820 1825 1830 

Ser Glu Tyr Lys Gly Pro val Thr Asp val Phe Tyr Lys Glu Thr 
1835 1840 1845 

ser Tyr Thr Thr Thr lie Lys Pro val ser Tyr Lys Leu Asp Gly 
1850 1855 I860 

Val Thr Tyr Thr Glu lie Glu Pro Lys Leu Asp Gly Tyr Tyr Lys 
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1865 1870 1875 

Lys Asp Asn Ala Tyr Tyr Thr Glu Gin Pro lie Asp Leu val Pro 
y 1880 1885 1890 

Thr Gin Pro Leu Pro Asn Ala Ser Phe Asp Asn Phe Lys Leu Thr 
1895 1900 1905 

Cvs ser Asn Thr Lys Phe Ala Asp Asp Leu Asn Gin Met Thr Gly 
1910 1915 1920 

Phe Thr Lys Pro Ala Ser Arg Glu Leu Ser val Thr Phe Phe Pro 
1925 1930 1935 

Asp Leu Asn Gly Asp val val Ala lie Asp Tyr Arg His Tyr Ser 
1940 1945 1950 

Ala ser Phe Lys Lys Gly Ala Lys Leu Leu His Lys Pro lie val 
1955 I960 1965 

Trp His He Asn Gin Ala Thr Thr Lys Thr Thr Phe Lys Pro Asn 
1970 1975 1980 

Thr Trp Cys Leu Arg cys Leu Trp Ser Thr Lys Pro val Asp Thr 
1985 1990 1995 

ser Asn ser Phe Glu val Leu Ala Val Glu Asp Thr Gin Gly Met 
2000 2005 2010 

Asp Asn Leu Ala Cys Glu ser Gin Gin Pro Thr Ser Glu Glu val 
2015 2020 2025 

val Glu Asn Pro Thr lie Gin Lys Glu Val lie Glu Cys Asp val 
2030 2035 2040 

Lys Thr Thr Glu Val val Gly Asn val lie Leu Lys Pro Ser Asp 
2045 2050 2055 

Glu Gly val Lys val Thr Gin Glu Leu Gly His Glu Asp Leu Met 
2060 2065 2070 

Ala Ala Tyr val Glu Asn Thr Ser lie Thr lie Lys Lys Pro Asn 
2075 2080 2085 

Glu Leu ser Leu Ala Leu Gly Leu Lys Thr lie Ala Thr His Gly 
2090 2095 2100 

lie Ala Ala He Asn ser val Pro Trp Ser Lys He Leu Ala Tyr 
2105 2110 2115 

Val Lys Pro Phe Leu Gly Gin Ala Ala lie Thr Thr ser Asn Cys 
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2120 2125 2130 

Ala Lys Arg Leu Ala Gin Arg Val Phe Asn Asn Tyr Met Pro Tyr 
2135 2140 2145 

val Phe Thr Leu Leu Phe Gin Leu Cys Thr Phe Thr Lys ser Thr 
2150 2155 2160 

Asn ser Arg lie Arg Ala Ser Leu Pro Thr Thr lie Ala Lys Asn 
2165 2170 2175 

ser val Lys ser Val Ala Lys Leu Cys Leu Asp Ala Gly lie Asn 
2180 2185 2190 

Tyr val Lys ser Pro Lys Phe ser Lys Leu Phe Thr lie Ala Met 
2195 2200 2205 

Trp Leu Leu Leu Leu Ser lie cys Leu Gly ser Leu lie cys val 
2210 2215 2220 

Thr Ala Ala Phe Gly val Leu Leu Ser Asn Phe Gly Ala Pro Ser 
2225 2230 2235 

Tyr cys Asn Gly Val Arg Glu Leu Tyr Leu Asn ser ser Asn val 
2240 2245 2250 

Thr Thr Met Asp Phe Cys Glu Gly Ser Phe Pro Cys Ser lie cys 
2255 2260 2265 

Leu Ser Gly Leu Asp ser Leu Asp ser Tyr pro Ala Leu Glu Thr 
2270 2275 2280 

lie Gin val Thr lie Ser ser Tyr Lys Leu Asp Leu Thr lie Leu 
2285 2290 2295 

Gly Leu Ala Ala Glu Trp val Leu Ala Tyr Met Leu Phe Thr Lys 
2300 2305 2310 

Phe Phe Tyr Leu Leu Gly Leu Ser Ala lie Met Gin val Phe Phe 
2315 2320 2325 

Gly Tyr Phe Ala Ser His Phe lie Ser Asn ser Trp Leu Met Trp 
2330 2335 2340 

Phe lie lie Ser He val Gin Met Ala Pro val ser Ala Met Val 
2345 2350 2355 

Arg Met Tyr lie Phe Phe Ala ser Phe Tyr Tyr lie Trp Lys ser 
2360 2365 . 2370 

Tyr val His lie Met Asp Gly cys Thr ser ser Thr cys Met Met 
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2375 2380 2385 

cys Tyr Lys Arg Asn Arg Ala Thr Arg Val Glu cys Thr Thr lie 
2390 2395 2400 

val Asn Gly Met Lys Arg ser Phe Tyr Val Tyr Ala Asn Gly Gly 
2405 2410 2415 

Arg Gly Phe Cys Lys Thr His Asn Trp Asn Cys Leu Asn cys Asp 
2420 2425 2430 

Thr Phe cys Thr Gly Ser Thr Phe lie ser Asp Glu Val Ala Arg 
2435 2440 2445 

Asp Leu Ser Leu Gin Phe Lys Arg Pro lie Asn Pro Thr Asp Gin 
2450 2455 2460 

ser ser Tyr lie Val Asp Ser Val Ala Val Lys Asn Gly Ala Leu 
2465 2470 2475 

His Leu Tyr Phe Asp Lys Ala Gly Gin Lys Thr Tyr Glu Arg His 
2480 2485 2490 

Pro Leu Ser His Phe val Asn Leu Asp Asn Leu Arg Ala Asn Asn 
2495 2500 2505 

Thr Lys Gly Ser Leu Pro lie Asn Val He val Phe Asp Gly Lys 
2510 2515 2520 

ser Lys cys Asp Glu ser Ala ser Lys Ser Ala Ser val Tyr Tyr 
2525 2530 2535 

Ser Gin Leu Met cys Gin Pro lie Leu Leu Leu Asp Gin Ala Leu 
2540 2545 2550 

val ser Asp Val Gly Asp ser Thr Glu val ser Val Lys Met Phe 
2555 2560 2565 

Asp Ala Tyr val Asp Thr Phe ser Ala Thr Phe Ser Val Pro Met 
2570 2575 2580 

Glu Lys Leu Lys Ala Leu val Ala Thr Ala His ser Glu Leu Ala 
2585 2590 2595 

Lys Gly val Ala Leu Asp Gly val Leu ser Thr Phe Val Ser Ala 
X 2600 2605 2610 

Ala Arq Gin Gly Val Val Asp Thr Asp Val Asp Thr Lys Asp Val 
2615 2620 2625 

He Glu Cys Leu Lys Leu Ser His His Ser Asp Leu Glu val Thr 
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2630 2635 2640 

Gly Asp ser cys Asn Asn phe Met Leu Thr Tyr Asn Lys val Glu 
2645 2650 2655 

Asn Met Thr pro Arg Asp Leu Gly Ala cys lie Asp cys Asn Ala 
2660 " 2665 2670 

Arg His He Asn Ala Gin val Ala Lys Ser His Asn val ser Leu 
2675 2680 2685 

lie Trp Asn Val Lys Asp Tyr Met ser Leu Ser Glu Gin Leu Arg 
2690 2695 2700 

Lys Gin lie Arg ser Ala Ala Lys Lys Asn Asn lie Pro Phe Arg 
2705 2710 2715 

Leu Thr Cys Ala Thr Thr Arg Gin Val val Asn Val lie Thr Thr 
2720 2725 2730 

Lys He ser Leu Lys Gly Gly Lys lie val ser Thr cys Phe Lys 
y 273 5 2740 2745 

Leu Met Leu Lys Ala Thr Leu Leu cys val Leu Ala Ala Leu Val 
2750 2755 2760 

Cys Tyr He Val Met Pro Val His Thr Leu Ser lie His Asp Gly 
2765 2770 2775 

Tyr Thr Asn Glu He lie Gly Tyr Lys Ala He Gin Asp Gly Val 
2780 2785 2790 

Thr Arg Asp lie lie Ser Thr Asp Asp cys Phe Ala Asn Lys His 
2795 2800 2805 

Ala Gly Phe Asp Ala Trp Phe Ser Gin Arg Gly Gly ser Tyr Lys 
2810 2815 2820 

Asn Asp Lys ser cys Pro Val Val Ala Ala lie lie Thr Arg Glu 
2825 2830 2835 

He Gly Phe lie val Pro Gly Leu Pro Gly Thr val Leu Arg Ala 
2840 2845 2850 

lie Asn Gly Asp Phe Leu His Phe Leu Pro Arg Val Phe ser Ala 
2855 2860 2865 

Val Gly Asn lie cys Tyr Thr Pro Ser Lys Leu lie Glu Tyr ser 
2870 2875 2880 

Asp Phe Ala Thr ser Ala cys val Leu Ala Ala Glu Cys Thr He 
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2885 2890 2895 

phe Lys Asp Ala Met Gly Lys Pro Val Pro Tyr cys Tyr Asp Thr 
2900 2905 2910 

Asn Leu Leu Glu Gly Ser lie Ser Tyr ser Glu Leu Arg Pro Asp 
2915 2920 2925 

Thr Arg Tyr val Leu Met Asp Gly Ser lie He Gin Phe Pro Asn 
2930 2935 2940 

Thr Tyr Leu Glu Gly ser val Arg val val Thr Thr Phe Asp Ala 
2945 2950 2955 

Glu Tyr cys Arg His Gly Thr cys Glu Arg ser Glu val Gly He 
2960 2965 2970 

cys Leu ser Thr ser Gly Arg Trp val Leu Asn Asn Glu His Tyr 
2975 2980 2985 

Arg Ala Leu ser Gly val Phe cys Gly Val Asp Ala Met Asn Leu 
a 2990 2995 3000 

lie Ala Asn lie Phe Thr Pro Leu val Gin Pro Val Gly Ala Leu 
3005 3010 3015 

Asp val ser Ala Ser val val Ala Gly Gly lie lie Ala lie Leu 
H 3020 3025 3030 

val Thr cys Ala Ala Tyr Tyr Phe Met Lys Phe Arg Arg Val Phe 
3035 3040 3045 

Gly Glu Tyr Asn His val val Ala Ala Asn Ala Leu Leu Phe Leu 
y 3050 3055 3060 

Met Ser Phe Thr He Leu Cys Leu val Pro Ala Tyr Ser Phe Leu 
3065 3070 3075 

pro Gly Val Tyr ser val Phe Tyr Leu Tyr Leu Thr Phe Tyr Phe 
3080 3085 3090 

Thr Asn Asp Val Ser Phe Leu Ala His Leu Gin Trp Phe Ala Met 
3095 3100 3105 

Phe Ser Pro lie val Pro Phe Trp He Thr Ala lie Tyr Val Phe 
3110 3115 3120 

Cys lie Ser Leu Lys His Cys His Trp Phe Phe Asn Asn Tyr Leu 
3125 3130 3135 

Arg Lys Arg Val Met Phe Asn Gly val Thr Phe ser Thr Phe Glu 
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3140 3145 3150 

Glu Ala Ala Leu cys Thr Phe Leu Leu Asn Lys Glu Met Tyr Leu 
3155 3160 3165 

Lys Leu Arg Ser Glu Thr Leu Leu Pro Leu Thr Gin Tyr Asn Arg 
y 3170 3175 3180 

Tyr Leu Ala Leu Tyr Asn Lys Tyr Lys Tyr Phe ser Gly Ala Leu 
3185 3190 3195 

Asp Thr Thr Ser Tyr Arg Glu Ala Ala cys cys His Leu Ala Lys 
3200 3205 3210 

Ala Leu Asn Asp Phe ser Asn ser Gly Ala Asp val Leu Tyr Gin 
3215 3220 3225 

pro Pro Gin Thr ser lie Thr ser Ala val Leu Gin Ser Gly Phe 
3230 3235 3240 

Arg Lys Met Ala Phe Pro Ser Gly Lys val Glu Gly cys Met Val 
3245 3250 3255 

Gin val Thr Cys Gly Thr Thr Thr Leu Asn Gly Leu Trp Leu Asp 
3260 3265 3270 

Asp Thr val Tyr Cys Pro Arg His val He cys Thr Ala Glu Asp 
3275 3280 3285 

Met Leu Asn Pro Asn Tyr Glu Asp Leu Leu lie Arg Lys Ser Asn 
3290 3295 3300 

His Ser Phe Leu val Gin Ala Gly Asn val Gin Leu Arg val lie 
3305 3310 3315 

Gly His Ser Met Gin Asn cys Leu Leu Arg Leu Lys Val Asp Thr 
3320 3325 3330 

Ser Asn Pro Lys Thr Pro Lys Tyr Lys Phe val Arg lie Gin Pro 
3335 3340 3345 

Gly Gin Thr Phe Ser val Leu Ala Cys Tyr Asn Gly Ser Pro Ser 
3350 3355 3360 

Gly val Tyr Gin Cys Ala Met Arg Pro Asn His Thr lie Lys Gly 
3365 3370 3375 

Ser Phe Leu Asn Gly ser cys Gly ser val Gly Phe Asn lie Asp 
3380 3385 3390 

Tyr Asp Cys Val ser Phe cys Tyr Met His His Met Glu Leu Pro 
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3395 3400 3405 

Thr Gly Val His Ala Gly Thr Asp Leu Glu Gly Lys Phe Tyr Gly 
3410 3415 3420 

pro Phe val Asp Arg Gin Thr Ala Gin Ala Ala Gly Thr Asp Thr 
3425 3430 3435 

Thr lie Thr Leu Asn val Leu Ala Trp Leu Tyr Ala Ala val lie 
3440 3445 3450 

Asn Gly Asp Arg Trp Phe Leu Asn Arg Phe Thr Thr Thr Leu Asn 
3455 3460 3465 

Asp Phe Asn Leu val Ala Met Lys Tyr Asn Tyr Glu Pro Leu Thr 
3470 3475 3480 

Gin Asp His Val Asp lie Leu Gly Pro Leu Ser Ala Gin Thr Gly 
3485 3490 3495 

lie Ala Val Leu Asp Met Cys Ala Ala Leu Lys Glu Leu Leu Gin 
3500 3505 3510 

Asn Gly Met Asn Gly Arg Thr He Leu Gly Ser Thr lie Leu Glu 
3515 3520 3525 

Asp Glu Phe Thr Pro Phe Asp val val Arg Gin cys ser Gly Val 
3530 3535 3540 

Thr Phe Gin Gly Lys Phe Lys Lys lie val Lys Gly Thr His His 
3545 3550 3555 

Trp Met Leu Leu Thr Phe Leu Thr ser Leu Leu lie Leu val Gin 
3560 3565 3570 

ser Thr Gin Trp ser Leu Phe Phe Phe Val Tyr Glu Asn Ala Phe 
3575 3580 3585 

Leu Pro Phe Thr Leu Gly lie Met Ala He Ala Ala Cys Ala Met 
3590 3595 3600 

Leu Leu val Lys His Lys His Ala Phe Leu Cys Leu Phe Leu Leu 
3605 3610 3615 

Pro ser Leu Ala Thr Val Ala Tyr Phe Asn Met Val Tyr Met Pro 
3620 3625 3630 

Ala ser Trp Val Met Arg lie Met Thr Trp Leu Glu Leu Ala Asp 
3635 3640 3645 

Thr ser Leu ser Gly Tyr Arg Leu Lys Asp Cys Val Met Tyr Ala 
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3650 3655 3660 

ser Ala Leu val Leu Leu He Leu Met Thr Ala Arg Thr val Tyr 
3665 3670 3675 

Asp Asp Ala Ala Arg Arg Val Trp Thr Leu Met Asn Val lie Thr 
3680 3685 3690 

Leu Val Tyr Lys val Tyr Tyr Gly Asn Ala Leu Asp Gin Ala He 
3695 3700 3705 

Ser Met Trp Ala Leu val lie ser Val Thr Ser Asn Tyr Ser Gly 
3710 3715 3720 

Val val Thr Thr He Met Phe Leu Ala Arg Ala lie val Phe val 
3725 3730 3735 

Cys Val Glu Tyr Tyr Pro Leu Leu phe He Thr Gly Asn Thr Leu 
3740 3745 3750 

Gin cys lie Met Leu Val Tyr cys Phe Leu Gly Tyr cys Cys Cys 
3755 3760 3765 

Cys Tyr Phe Gly Leu Phe Cys Leu Leu Asn Arg Tyr Phe Arg Leu 
3770 3775 3780 

Thr Leu Gly val Tyr Asp Tyr Leu val Ser Thr Gin Glu Phe Arg 
3785 3790 3795 

Tyr Met Asn Ser Gin Gly Leu Leu Pro Pro Lys Ser ser lie Asp 
3800 3805 3810 

Ala Phe Lys Leu Asn lie Lys Leu Leu Gly lie Gly Gly Lys pro 
3815 3820 3825 

Cys lie Lys Val Ala Thr val Gin Ser Lys Met ser Asp Val Lys 
3830 3835 3840 

cvs Thr ser val val Leu Leu Ser val Leu Gin Gin Leu Arg Val 
3845 3850 3855 

Glu ser ser ser Lys Leu Trp Ala Gin Cys Val Gin Leu His Asn 
3860 3865 3870 

Asp lie Leu Leu Ala Lys Asp Thr Thr Glu Ala Phe Glu Lys Met 
F 3875 3880 3885 

Val ser Leu Leu ser val Leu Leu Ser Met Gin Gly Ala val Asp 
3890 3895 3900 

He Asn Arg Leu cys Glu Glu Met Leu Asp Asn Arg Ala Thr Leu 
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3905 3910 3915 

Gin Ala lie Ala Ser Glu Phe ser Ser Leu Pro Ser Tyr Ala Ala 
3920 3925 3930 

Tyr Ala Thr Ala Gin Glu Ala Tyr Glu Gin Ala val Ala Asn Gly 
3935 3940 3945 

Asp ser Glu Val Val Leu Lys Lys Leu Lys Lys ser Leu Asn Val 
3950 3955 3960 

Ala Lys ser Glu Phe Asp Arg Asp Ala Ala Met Gin Arg Lys Leu 
3965 3970 3975 

Glu Lys Met Ala Asp Gin Ala Met Thr Gin Met Tyr Lys Gin Ala 
3980 3985 3990 

Arg ser Glu Asp Lys Arg Ala Lys val Thr ser Ala Met Gin Thr 
3995 4000 4005 

Met Leu Phe Thr Met Leu Arg Lys Leu Asp Asn Asp Ala Leu Asn 
4010 4015 4020 

Asn He lie Asn Asn Ala Arg Asp Gly Cys Val Pro Leu Asn lie 
4025 4030 4035 

He Pro Leu Thr Thr Ala Ala Lys Leu Met Val Val val Pro Asp 
4040 4045 4050 

Tyr Gly Thr Tyr Lys Asn Thr cys Asp Gly Asn Thr Phe Thr Tyr 
4055 4060 4065 

Ala ser Ala Leu Trp Glu lie Gin Gin Val Val Asp Ala Asp Ser 
4070 4075 4080 

Lys lie val Gin Leu ser Glu lie Asn Met Asp Asn ser Pro Asn 
4085 4090 4095 

Leu Ala Trp Pro Leu lie val Thr Ala Leu Arg Ala Asn ser Ala 
4100 4105 4110 

val Lys Leu Gin Asn Asn Glu Leu ser Pro val Ala Leu Arg Gin 
4115 4120 4125 

Met ser cys Ala Ala Gly Thr Thr Gin Thr Ala cys Thr Asp Asp 
4130 4135 4140 

Asn Ala Leu Ala Tyr Tyr Asn Asn ser Lys Gly Gly Arg Phe Val 
4145 4150 4155 

Leu Ala Leu Leu ser Asp His Gin Asp Leu Lys Trp Ala Arg Phe 
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4160 4165 4170 

pro Lys Ser Asp Gly Thr Gly Thr lie Tyr Thr Glu Leu Glu pro 
4175 4180 4185 

pro cys Arg Phe Val Thr Asp Thr Pro Lys Gly Pro Lys val Lys 
4190 4195 4200 

Tvr Leu Tyr Phe He Lys Gly Leu Asn Asn Leu Asn Arg Gly Met 
4205 4210 4215 

val Leu Gly ser Leu Ala Ala Thr val Arg Leu Gin Ala Gly Asn 
4220 4225 4230 

Ala Thr Glu val Pro Ala Asn ser Thr val Leu Ser Phe Cys Ala 
4235 4240 4245 

Phe Ala val Asp Pro Ala Lys Ala Tyr Lys Asp Tyr Leu Ala ser 
4250 4255 4260 

Gly Gly Gin Pro He Thr Asn cys val Lys Met Leu Cys Thr His 
4265 4270 4275 

Thr Gly Thr Gly Gin Ala lie Thr val Thr Pro Glu Ala Asn Met 
4280 4285 4290 

Asp Gin Glu ser Phe Gly Gly Ala Ser Cys Cys Leu Tyr Cys Arg 
4295 4300 4305 

Cys His lie Asp His Pro Asn Pro Lys Gly Phe cys Asp Leu Lys 
4310 4315 4320 

Gly Lys Tyr val Gin lie Pro Thr Thr Cys Ala Asn Asp Pro val 
4325 4330 4335 

Gly Phe Thr Leu Arg Asn Thr val cys Thr Val Cys Gly Met Trp 
4340 " 4345 4350 

Lys Gly Tyr Gly cys ser cys Asp Gin Leu Arg Glu Pro Leu Met 
4355 4360 4365 

Gin ser Ala Asp Ala ser Thr Phe Leu Asn Gly Phe Ala Val 
4370 4375 4380 

<210> 75 
<211> 2695 
<212> PRT 
<213> CORONAVIRUS 
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<400> 75 

Arg Val Cys Gly val Ser Ala Ala Arg Leu Thr Pro Cys Gly Thr Gly 
1 5 10 15 

Thr Ser Thr Asp Val Val Tyr Arg Ala Phe Asp lie Tyr Asn Glu Lys 
20 25 30 

val Ala Gly Phe Ala Lys Phe Leu Lys Thr Asn cys cys Arg Phe Gin 
35 40 45 

Glu Lys Asp Glu Glu Gly Asn Leu Leu Asp ser Tyr Phe val val Lys 
50 55 60 

Arg His Thr Met ser Asn Tyr Gin His Glu Glu Thr lie Tyr Asn Leu 
65 70 75 80 

Val Lys Asp Cys Pro Ala Val Ala val His Asp Phe Phe Lys Phe Arg 
85 90 95 

val Asp Gly Asp Met val Pro His lie Ser Arg Gin Arg Leu Thr Lys 
100 105 110 

Tyr Thr Met Ala Asp Leu Val Tyr Ala Leu Arg His Phe Asp Glu Gly 
115 120 125 

Asn Cys Asp Thr Leu Lys Glu lie Leu val Thr Tyr Asn Cys cys Asp 
130 135 140 

Asp Asp Tyr Phe Asn Lys Lys Asp Trp Tyr Asp Phe Val Glu Asn Pro 
145 150 155 160 

Asp lie Leu Arg val Tyr Ala Asn Leu Gly Glu Arg Val Arg Gin ser 
165 170 175 

Leu Leu Lys Thr val Gin Phe Cys Asp Ala Met Arg Asp Ala Gly lie 
180 185 190 

Val Gly val Leu Thr Leu Asp Asn Gin Asp Leu Asn Gly Asn Trp Tyr 
195 200 205 

Asp Phe Gly Asp phe val Gin val Ala Pro Gly cys Gly Val Pro lie 
210 215 220 

Val asp ser Tyr Tyr ser Leu Leu Met Pro lie Leu Thr Leu Thr Arg 
225 230 235 240 

Ala Leu Ala Ala Glu Ser His Met Asp Ala Asp Leu Ala Lys Pro Leu 
245 250 255 

He Lys Trp Asp Leu Leu Lys Tyr Asp Phe Thr Glu Glu Arg Leu Cys 
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260 265 270 

Leu Phe Asp Arg Tyr Phe Lys Tyr Trp Asp Gin Thr Tyr His Pro Asn 
275 280 285 

Cys He Asn Cys Leu Asp Asp Arg cys lie Leu His cys Ala Asn Phe 
290 295 300 

Asn val Leu Phe ser Thr val Phe Pro Pro Thr ser Phe Gly Pro Leu 
305 310 315 320 

Val Arg Lys lie Phe val Asp Gly val Pro Phe val val Ser Thr Gly 
325 330 335 

Tyr His Phe Arg Glu Leu Gly Val val His Asn Gin Asp val Asn Leu 
y 340 345 350 

His ser ser Arg Leu Ser Phe Lys Glu Leu Leu val Tyr Ala Ala Asp 
355 360 365 

Pro Ala Met His Ala Ala Ser Gly Asn Leu Leu Leu Asp Lys Arg Thr 
370 375 380 

Thr cys Phe Ser Val Ala Ala Leu Thr Asn Asn val Ala Phe Gin Thr 
385 390 395 400 

Val Lys Pro Gly Asn Phe Asn Lys Asp Phe Tyr Asp Phe Ala val ser 
405 410 415 

Lys Gly Phe Phe Lys Glu Gly Ser ser val Glu Leu Lys His Phe Phe 
420 425 430 

Phe Ala Gin Asp Gly Asn Ala Ala lie Ser Asp Tyr Asp Tyr Tyr Arg 
435 440 445 

Tyr Asn Leu Pro Thr Met cys Asp lie Arg Gin Leu Leu Phe val val 
450 455 460 

Glu val val Asp Lys Tyr Phe Asp Cys Tyr Asp Gly Gly Cys lie Asn 
465 470 475 480 

Ala Asn Gin Val He val Asn Asn Leu Asp Lys Ser Ala Gly Phe Pro 
485 490 495 

Phe Asn Lys Trp Gly Lys Ala Arg Leu Tyr Tyr Asp ser Met Ser Tyr 
500 505 510 

Glu Asp Gin Asp Ala Leu Phe Ala Tyr Thr Lys Arg Asn val lie Pro 
515 520 525 

Thr lie Thr Gin Met Asn Leu Lys Tyr Ala lie ser Ala Lys Asn Arg 
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530 535 540 

Ala Arg Thr val Ala Gly Val ser lie Cys Ser Thr Met Thr Asn Arg 
545 550 555 560 

Gin Phe His Gin Lys Leu Leu Lys ser lie Ala Ala Thr Arg Gly Ala 
565 570 575 

Thr Val val lie Gly Thr Ser Lys Phe Tyr Gly Gly Trp His Asn Met 
580 585 590 

Leu Lys Thr val Tyr ser Asp Val Glu Thr Pro His Leu Met Gly Trp 
595 600 605 

Asp Tyr Pro Lys cys Asp Arg Ala Met Pro Asn Met Leu Arg lie Met 
610 615 620 

Ala ser Leu val Leu Ala Arg Lys His Asn Thr Cys cys Asn Leu ser 
625 630 635 640 

His Arg Phe Tyr Arg Leu Ala Asn Glu Cys Ala Gin Val Leu ser Glu 
645 650 655 

Met val Met Cys Gly Gly Ser Leu Tyr Val Lys Pro Gly Gly Thr Ser 
660 665 670 

ser Gly Asp Ala Thr Thr Ala Tyr Ala Asn ser Val Phe Asn lie cys 
675 680 685 

Gin Ala val Thr Ala Asn val Asn Ala Leu Leu ser Thr Asp Gly Asn 
690 695 700 

Lys lie Ala Asp Lys Tyr val Arg Asn Leu Gin His Arg Leu Tyr Glu 
705 710 715 720 

cys Leu Tyr Arg Asn Arg Asp Val Asp His Glu Phe val Asp Glu Phe 
725 730 735 

Tyr Ala Tyr Leu Arg Lys His Phe Ser Met Met lie Leu Ser Asp Asp 
740 745 750 

Ala Val val cys Tyr Asn ser Asn Tyr Ala Ala Gin Gly Leu Val Ala 
755 760 765 

Ser lie Lys Asn Phe Lys Ala val Leu Tyr Tyr Gin Asn Asn Val Phe 
770 775 780 

Met ser Glu Ala Lys cys Trp Thr Glu Thr Asp Leu Thr Lys Gly Pro 
785 790 795 800 

His Glu Phe cys ser Gin His Thr Met Leu val Lys Gin Gly Asp Asp 
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805 810 815 

Tyr Val Tyr Leu Pro Tyr Pro Asp Pro ser Arg lie Leu Gly Ala Gly 
820 825 830 

Cvs Phe val Asp Asp lie val Lys Thr Asp Gly Thr Leu Met lie Glu 
835 840 845 

Arg Phe val ser Leu Ala lie Asp Ala Tyr Pro Leu Thr Lys His Pro 
850 855 860 

Asn Gin Glu Tyr Ala Asp val Phe His Leu Tyr Leu Gin Tyr lie Arg 
865 870 875 880 

Lys Leu His Asp Glu Leu Thr Gly His Met Leu Asp Met Tyr ser val 
y 885 890 895 

Met Leu Thr Asn Asp Asn Thr Ser Arg Tyr Trp Glu Pro Glu Phe Tyr 
900 905 910 

Glu Ala Met Tyr Thr Pro His Thr val Leu Gin Ala Val Gly Ala Cys 
915 920 925 

val Leu cys Asn Ser Gin Thr Ser Leu Arg cys Gly Ala cys He Arg 
930 935 940 

Arg Pro Phe Leu cys cys Lys cys cys Tyr Asp His val lie Ser Thr 
945 950 955 960 

Ser His Lys Leu val Leu Ser Val Asn Pro Tyr val Cys Asn Ala Pro 
965 970 975 

Gly cys Asp val Thr Asp val Thr Gin Leu Tyr Leu Gly Gly Met Ser 
980 985 990 

Tvr Tyr cys Lys ser His Lys Pro Pro lie Ser Phe Pro Leu Cys Ala 
995 1000 1005 

Asn Gly Gin val Phe Gly Leu Tyr Lys Asn Thr cys Val Gly ser 
1010 1015 1020 

Asp Asn val Thr Asp Phe Asn Ala lie Ala Thr cys Asp Trp Thr 
1025 1030 1035 

Asn Ala Gly Asp Tyr He Leu Ala Asn Thr cys Thr Glu Arg Leu 
1040 1045 1050 

Lys Leu Phe Ala Ala Glu Thr Leu Lys Ala Thr Glu Glu Thr Phe 
1055 1060 1065 

Lys Leu ser Tyr Gly lie Ala Thr val Arg Glu Val Leu Ser Asp 
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1070 1075 1080 

Arg Glu Leu His Leu ser Trp Glu Val Gly Lys Pro Arg pro Pro 
1085 1090 1095 

Leu Asn Arg Asn Tyr val Phe Thr Gly Tyr Arg Val Thr Lys Asn 
1100 1105 1110 

ser Lys val Gin lie Gly Glu Tyr Thr Phe Glu Lys Gly Asp Tyr 
1115 1120 1125 

Gly Asp Ala Val val Tyr Arg Gly Thr Thr Thr Tyr Lys Leu Asn 
1130 1135 1140 

val Gly Asp Tyr Phe val Leu Thr Ser His Thr val Met Pro Leu 
1145 1150 1155 

ser Ala Pro Thr Leu Val Pro Gin Glu His Tyr val Arg lie Thr 
1160 1165 1170 

Gly Leu Tyr Pro Thr Leu Asn lie ser Asp G~lu Phe Ser Ser Asn 
1175 1180 1185 

val Ala Asn Tyr Gin Lys Val Gly Met Gin Lys Tyr Ser Thr Leu 
1190 1195 1200 

Gin Gly Pro pro Gly Thr Gly Lys Ser His Phe Ala He Gly Leu 
1205 1210 1215 

Ala Leu Tyr Tyr Pro ser Ala Arg lie val Tyr Thr Ala cys Ser 
1220 1225 1230 

His Ala Ala val Asp Ala Leu Cys Glu Lys Ala Leu Lys Tyr Leu 
1235 1240 1245 

Pro lie Asp Lys cys Ser Arg lie lie Pro Ala Arg Ala Arg Val 
1250 1255 1260 

Glu Cys Phe Asp Lys Phe Lys val Asn Ser Thr Leu Glu Gin Tyr 
1265 1270 1275 

val Phe Cys Thr val Asn Ala Leu Pro Glu Thr Thr Ala Asp lie 
1280 1285 1290 

val val Phe Asp Glu lie ser Met Ala Thr Asn Tyr Asp Leu Ser 
1295 1300 1305 

val val Asn Ala Arg Leu Arg Ala Lys His Tyr Val Tyr lie Gly 
1310 1315 1320 

Asp pro Ala Gin Leu Pro Ala Pro Arg Thr i_eu Leu Thr Lys Gly 
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1325 1330 1335 

Thr Leu Glu Pro Glu Tyr Phe Asn ser Val cys Arg Leu Met Lys 
1340 1345 1350 

Thr lie Gly Pro Asp Met Phe Leu Gly Thr cys Arg Arg cys Pro 
1355 1360 1365 

Ala Glu lie Val Asp Thr val ser Ala Leu val Tyr Asp Asn Lys 
1370 1375 1380 

Leu Lys Ala His Lys Asp Lys Ser Ala Gin Cys Phe Lys Met Phe 
1385 1390 1395 

Tyr Lys Gly Val lie Thr His Asp Val Ser Ser Ala lie Asn Arg 
1400 1405 1410 

pro Gin lie Gly val val Arg Glu Phe Leu Thr Arg Asn Pro Ala 
1415 1420 1425 

Trp Arg Lys Ala val Phe lie Ser Pro Tyr Asn ser Gin Asn Ala 
1430 1435 1440 

val Ala ser Lys lie Leu Gly Leu Pro Thr Gin Thr val Asp Ser 
1445 1450 1455 

ser Gin Gly ser Glu Tyr Asp Tyr Val lie Phe Thr Gin Thr Thr 
1460 1465 1470 

Glu Thr Ala His ser cys Asn val Asn Arg Phe Asn val Ala lie 
1475 1480 1485 

Thr Arg Ala Lys lie Gly lie Leu cys lie Met Ser Asp Arg Asp 
1490 1495 1500 

Leu Tyr Asp Lys Leu Gin Phe Thr ser Leu Glu lie Pro Arg Arg 
1505 1510 1515 

Asn Val Ala Thr Leu Gin Ala Glu Asn val Thr Gly Leu Phe Lys 
1520 1525 1530 

Asp cys Ser Lys lie lie Thr Gly Leu His Pro Thr Gin Ala Pro 
1535 1540 1545 

Thr His Leu ser val Asp lie Lys Phe Lys Thr Glu Gly Leu Cys 
1550 1555 1560 

val Asp He Pro Gly lie pro Lys Asp Met Thr Tyr Arg Arg Leu 
1565 1570 1575 

lie ser Met Met Gly Phe Lys Met Asn Tyr Gin val Asn Gly Tyr 
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1580 1585 1590 

Pro Asn Met Phe lie Thr Arg Glu Glu Ala lie Arg His Val Arg 
1595 1600 1605 

Ala Trp lie Gly Phe Asp Val Glu Gly Cys His Ala Thr Arg Asp 
1610 1615 1620 

Ala val Gly Thr Asn Leu Pro Leu Gin Leu Gly Phe ser Thr Gly 
1625 1630 1635 

val Asn Leu val Ala val Pro Thr Gly Tyr val Asp Thr Glu Asn 
1640 1645 1650 

Asn Thr Glu Phe Thr Arg val Asn Ala Lys pro Pro Pro Gly Asp 
1655 1660 1665 

Gin Phe Lys His Leu lie Pro Leu Met Tyr Lys Gly Leu Pro Trp 
1670 1675 1680 

Asn val val Arg lie Lys lie val Gin Met Leu ser Asp Thr Leu 
1685 ~ 1690 1695 

Lys Gly Leu Ser Asp Arg val Val Phe Val Leu Trp Ala His Gly 
1700 1705 1710 

Phe Glu Leu Thr ser Met Lys Tyr Phe val Lys lie Gly Pro Glu 
1715 1720 1725 

Arg Thr cys cys Leu cys Asp Lys Arg Ala Thr cys Phe Ser Thr 
1730 1735 1740 

ser ser Asp Thr Tyr Ala Cys Trp Asn His Ser val Gly Phe Asp 
1745 1750 1-755 

Tyr val Tyr Asn Pro Phe Met lie Asp val Gin Gin Trp Gly Phe 
1760 1765 1-770 

Thr Gly Asn Leu Gin ser Asn His Asp Gin His Cys Gin Val His 
1775 1780 3-785 

Gly Asn Ala His val Ala ser cys Asp Ala He Met Thr Arg cys 
1790 1795 1800 

Leu Ala val His Glu cys Phe Val Lys Arg Val Asp Trp Ser Val 
1805 1810 1815 

Glu Tvr Pro lie lie Gly Asp Glu Leu Arg val Asn Ser Ala cys 
1820 1825 1830 

Arg Lys Val Gin His Met val val Lys ser Ala Leu Leu Ala Asp 

page 112 



WO 2005/056781 PCT/FR2004/003105 

S226CAS111.ST25 
1835 1840 1845 

Lys Phe Pro val Leu His Asp He Gly Asn Pro Lys Ala He Lys 
1850 1855 I860 

Cys val Pro Gin Ala Glu val Glu Trp Lys Phe Tyr Asp Ala Gin 
1865 1870 1875 

Pro cys ser Asp Lys Ala Tyr Lys lie Glu Glu Leu Phe Tyr Ser 
1880 1885 1890 

Tyr Ala Thr His His Asp Lys Phe Thr Asp Gly Val cys Leu Phe 
y 1895 1900 1905 

Trp Asn cys Asn val Asp Arg Tyr Pro Ala Asn Ala lie val cys 
1910 1915 1920 

Arg Phe Asp Thr Arg val Leu ser Asn Leu Asn Leu Pro Gly cys 
1925 1930 1935 

Asp Gly Gly Ser Leu Tyr val Asn Lys His Ala Phe His Thr Pro 
K 1940 1945 1950 

Ala Phe Asp Lys ser Ala Phe Thr Asn Leu Lys Gin Leu Pro Phe 
1955 I960 1965 

Phe Tyr Tyr ser Asp ser pro cys Glu Ser His Gly Lys Gin Val 
1570 1975 1980 

val ser Asp lie Asp Tyr val Pro Leu Lys Ser Ala Thr cys lie 
1985 1990 1995 

Thr Arg cys Asn Leu Gly Gly Ala val cys Arg His His Ala Asn 
2000 2005 2010 

Glu Tyr Arg Gin Tyr Leu Asp Ala Tyr Asn Met Met lie Ser Ala 
2015 2020 2025 

Gly Phe ser Leu Trp lie Tyr Lys Gin Phe Asp Thr Tyr Asn Leu 
2030 2035 2040 

Trp Asn Thr Phe Thr Arg Leu Gin ser Leu Glu Asn Val Ala Tyr 
2045 2050 2055 

Asn val val Asn Lys Gly His Phe Asp Gly His Ala Gly Glu Ala 
2060 2065 2070 

Pro val ser lie He Asn Asn Ala val Tyr Thr Lys val Asp Gly 
2075 2080 2085 

He Asp val Glu He Phe Glu Asn Lys Thr Thr Leu Pro Val Asn 
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2090 2095 2100 

val Ala Phe Glu Leu Trp Ala Lys Arg Asn lie Lys Pro val Pro 
2105 2110 2115 

Glu He Lys lie Leu Asn Asn Leu Gly Val Asp lie Ala Ala Asn 
2120 2125 2130 

Thr val lie Trp Asp Tyr Lys Arg Glu Ala Pro Ala His val Ser 
2135 2140 2145 

Thr He Gly val cys Thr Met Thr Asp lie Ala Lys Lys Pro Thr 
2150 2155 2160 

Glu Ser Ala cys Ser Ser Leu Thr val Leu Phe Asp Gly Arg val 
2165 2170 2175 

Glu Gly Gin Val Asp Leu Phe Arg Asn Ala Arg Asn Gly val Leu 
2180 2185 2190 

lie Thr Glu Gly Ser val Lys Gly Leu Thr Pro ser Lys Gly Pro 
2195 2200 2205 

Ala Gin Ala Ser Val Asn Gly Val Thr Leu lie Gly Glu ser val 
2210 2215 2220 

Lys Thr Gin Phe Asn Tyr Phe Lys Lys val Asp Gly lie He Gin 
2225 2230 2235 

Gin Leu Pro Glu Thr Tyr Phe Thr Gin Ser Arg Asp Leu Glu Asp 
2240 2245 2250 

Phe Lys Pro Arg ser Gin Met Glu Thr Asp Phe Leu Glu Leu Ala 
2255 2260 2265 

Met Asp Glu Phe lie Gin Arg Tyr Lys Leu Glu Gly Tyr Ala Phe 
2270 2275 2280 

Glu His He Val Tyr Gly Asp Phe ser His Gly Gin Leu Gly Gly 
2285 2290 2295 

Leu His Leu Met He Gly Leu Ala Lys Arg ser Gin Asp Ser Pro 
2300 2305 2310 

Leu Lys Leu Glu Asp Phe He Pro Met Asp ser Thr val Lys Asn 
2315 2320 2325 

Tyr Phe He Thr Asp Ala Gin Thr Gly ser ser Lys cys val cys 
y 2330 2335 2340 

ser val lie Asp Leu Leu Leu Asp Asp phe Val Glu He lie Lys 
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2345 2350 23 55 

ser Gin Asp Leu Ser Val He Ser Lys Val Val Lys val Thr He 
2360 2365 2370 

Asp Tyr Ala Glu lie Ser Phe Met Leu Trp Cys Lys Asp Gly His 
K 2375 2380 2385 

val Glu Thr Phe Tyr pro Lys Leu Gin Ala ser Gin Ala Trp Gin 
2390 2395 2400 

Pro Gly val Ala Met Pro Asn Leu Tyr Lys Met Gin Arg Met Leu 
2405 2410 2415 

Leu Glu Lys Cys Asp Leu Gin Asn Tyr Gly Glu Asn Ala val He 
2420 2425 2430 

Pro Lys Gly lie Met Met Asn val Ala Lys Tyr Thr Gin Leu Cys 
2435 2440 2445 

Gin Tyr Leu Asn Thr Leu Thr Leu Ala Val Pro Tyr Asn Met Arg 
2450 2455 2460 

val He His Phe Gly Ala Gly Ser Asp Lys Gly val Ala pro Gly 
2465 2470 2475 

Thr Ala val Leu Arg Gin Trp Leu Pro Thr Gly Thr Leu Leu val 
2480 2485 2490 

Asp Ser Asp Leu Asn Asp Phe Val Ser Asp Ala Asp Ser Thr Leu 
2495 2500 2505 

lie Gly Asp cys Ala Thr val His Thr Ala Asn Lys Trp Asp Leu 
2510 2515 2520 

He He ser Asp Met Tyr Asp Pro Arg Thr Lys His val Thr Lys 
2525 2530 2535 

Glu Asn Asp Ser Lys Glu Gly Phe Phe Thr Tyr Leu cys Gly Phe 
2540 2545 2550 

He Lys Gin Lys Leu Ala Leu Gly Gly ser lie Ala val Lys lie 
2555 2560 2565 

Thr Glu His ser Trp Asn Ala Asp Leu Tyr Lys Leu Met Gly His 
2570 2575 2 580 

Phe ser Trp Trp Thr Ala Phe val Thr Asn Val Asn Ala ser Ser 
2585 2590 2 595 

ser Glu Ala Phe Leu lie Gly Ala Asn Tyr Leu Gly Lys Pro Lys 
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Glu Gin lie Asp Gly Tyr Thr Met His Ala Asn Tyr lie Phe Trp 
2615 2620 2625 

Arg Asn Thr Asn Pro lie Gin Leu Ser Ser Tyr ser Leu Phe Asp 
2630 2635 2640 

Met ser Lys Phe Pro Leu Lys Leu Arg Gly Thr Ala val Met ser 
2645 2650 2655 

Leu Lys Glu Asn Gin lie Asn Asp Met He Tyr Ser Leu Leu Glu 
2660 2665 2670 

Lys Gly Arg Leu lie lie Arg Glu Asn Asn Arg val val val Ser 
2675 2680 2685 

Ser Asp lie Leu val Asn Asn 
2690 2695 

<210> 76 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L3/+/4932 

<400> 76 

ccacacacag cttgtggata 

<210> 77 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L4/+/6401 
<400> 77 

ccgaagttgt aggcaatgtc 

<210> 78 
<211> 20 
<212> DNA 
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<220> 

<223> amorce S/L4/+/6964 

<400> 78 , n 
tttggtgctc cttcttattg ^ u 

<210> 79 
<211> 20 
<212> .DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L4/-/6817 

<400> 79 , n 
ccggcatcca aacataattt * u 

<210> 80 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L5/-/7633 



20 



<400> 80 

tggtcagtag ggttgattgg 

<210> 81 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> S/L5/-/8127 

<400> 81 7n 
catcctttgt gtcaacatcg ^ u 



<210> 82 
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<211> 20 
<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L5/-/8633 
<400> 82 

gtcacgagtg acaccatcct 

<210> 83 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L5/+/7839 

<400> 83 

atgcgacgag tctgcttcta 

<210> 84 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L5/+/8785 

<400> 84 

ttcatagtgc ctggcttacc 

<210> 85 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L5/+/8255 

<400> 85 
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atcttggcgc atgtattgac 20 

<210> 86 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L6/-/9422 

<400> 86 

tgcattagca gcaacaacat 

<210> 87 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L6/-/9966 

<400> 87 

tctgcagaac agcagaagtg 

<210> 88 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L6/-/10542 

<400> 88 

cctgtgcagt ttgtctgtca 

<210> 89 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 
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<223> amorce S/L6/+/10677 
<400> 89 

ccttgtggca atgaagtaca 

<210> 90 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L6/+/10106 

<400> 90 

atgtcatttg cacagcagaa 

<210> 91 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L6/+/9571 

<400> 91 

cttcaatggt ttgccatgtt 

<210> 92 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L7/-/11271 

<400> 92 

tgcgagctgt catgagaata 

<210> 93 
<211> 20 
<212> DNA 

<213> Artificial sequence 
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<220> 

<223> amorce S/L7/-/11801 
<400> 93 

aaccgagagc agtaccacag 

<210> 94 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L7/-/12383 

<400> 94 

tttggctgct gtagtcaatg 

<210> 95 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L7/+/12640 

<400> 95 

ctacgacaga tgtcctgtgc 

<210> 96 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L7/+/12088 

<400> 96 

gagcaggctg tagctaatgg 



S226CAS111.ST25 



20 



20 



20 



<210> 97 
<211> 20 
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<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L7/+/H551 
<400> 97 

ttaggctatt gttgctgctg 

<210> 98 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L8/-/13160 

<400> 98 

cagacaacat gaagcaccac 

<210> 99 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L8/-/13704 

<400> 99 

cgctgacgtg atatatgtgg 

<210> 100 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L8/-/14284 

<400> 100 

tgcacaatga aggatacacc 



20 
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<210> 101 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L8/+/14453 

<400> 101 

acatagctcg cgtctcagtt 

<210> 102 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L8/+/13968 

<400> 102 

ggcattgtag gcgtactgac 

<210> 103 

<211> 19 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L8/+/13401 

<400> 103 
gtttgcggtg taagtgcag 

<210> 104 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L9/-/15098 



S226CAS111.ST25 



20 



20 



19 
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<400> 104 

tagtggcggc tattgacttc ^ u 

<210> 105 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L9/-/15677 

<400> 105 

ctaaaccttg agccgcatag 

<210> 106 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L9/-/16247 

<400> 106 

catggtcata gcagcacttg 

<210> 107 

<211> 21 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L9/+/16323 
<400> 107 

ccaggttgtg atgtcactga t 

<210> 108 
<211> 20 
<212> DNA 

<213> Artificial sequence 
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<220> 

<223> amorce S/L9/+/15858 

<400> 108 

ccttacccag atccatcaag 

<210> 109 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L9/+/15288 

<400> 109 

cgcaaacata acacttgctg 

<210> 110 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L10/-/16914 

<400> 110 

agtgttgggt acaagccagt 

<210> 111 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L10/-/17466 

<400> 111 

gttccaagga acatgtctgg 

<210> 112 

<211> 20 

<212> DNA 



S226CASU1.ST25 



20 



20 



20 



20 
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<220> 

<223> amorce S/L10/-/18022 

<400> 112 

aggtgcctgt gtaggatgaa 20 

<210> 113 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L10/+/18245 

<400> 113 

gggctgtcat gcaactagag 20 

<210> 114 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L10/+/17663 

<400> 114 

tcttacacgc aatcctgctt 20 

<210> 115 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L10/+/17061 
<400> 115 

tacccatctg ctcgcatagt 20 



<210> 116 
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<211> 20 
<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L11/-/18877 
<400> 116 

gcaagcagaa ttaaccctca 

<210> 117 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L11/-/19396 

<400> 117 

agcaccacct aaattgcatc 

<210> 118 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L11/-/2OO02 

<400> 118 

tggtcccttt gaaggtgtta 

<210> 119 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce S/L11/+/20245 

<400> 119 
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tcgaacacat cgtttatgga 20 

<210> 120 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L11/+/19611 

<400> 120 

gaagcacctg tttccatcat 

<210> 121 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce S/L11/+/19021 

<400> 121 

acgatgctca gccatgtagt 

<210> 122 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce SARS/L1/F3/+/800 

<400> 122 

gaggtgcagt cactcgctat 

<210> 123 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 
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<223> amorce SARS/L1/F4/+/1391 
<400> 123 

cagagattgg acctgagcat 

<210> 124 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SARS/L1/F5/+/1925 

<400> 124 

cagcaaacca ctcaattcct 

<210> 125 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SARS/L1/R3/-/1674 

<400> 125 

aaatgatggc aacctcttca 

<210> 126 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SARS/L1/R4/-/1107 

<400> 126 

cacgtggttg aatgactttg 

<210> 127 
<211> 20 
<212> DNA 

<213> Artificial sequence 
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<220> 

<223> amorce SARS/L1/R5/-/520 
<400> 127 

atttctgcaa ccagctcaac 

<210> 128 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SARS/L2/F3/+/2664 

<400> 128 

cgcattgtct cctggtttac 

<210> 129 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SARS/L2/F4/+/3232 

<400> 129 

gagattgagc cagaaccaga 

<210> 130 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SARS/L2/F5/+/3746 

<400> 130 

atgagcaggt tgtcatggat 



<210> 131 
<211> 20 
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<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce SARS/L2/R3/-/3579 

<400> 131 

ctgccttaag aagctggatg 

<210> 132 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce SARS/L2/R4/-/2991 

<400> 132 

tttcttcacc agcatcatca 

<210> 133 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce SARS/L2/R5/-/2529 

<400> 133 

caccgttctt gagaacaacc 

<210> 134 

<211> 20 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce SARS/L3/F3/+/4708 
<400> 134 

tctttggctg gctcttacag 
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<210> 135 
<211> 20 
<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SRAS/L3/F4/+/5305 
<400> 135 

gctggtgatg ctgctaactt 

<210> 136 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SARS/L3/F5/+/5822 

<400> 136 

ccatcaagcc tgtgtcgtat 

<210> 137 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SARS/L3/R3/-/5610 

<400> 137 

caggtggtgc agacatcata 

<210> 138 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SARS/L3/R4/-/4988 
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<400> 138 

aacatcagca ccatccaagt 

<210> 139 

<211> 20 

<212> DNA 

<213> Artificial sequence 



20 



<220> 

<223> amorce SARS/L3/R5/-/4437 

<400> 139 

atcggacacc atagtcaacg 

<210> 140 

<211> 7788 

<212> DNA 

<213> Artificial sequence 



<220> 








<223> gene S synthetique 




<400> 140 
tcaatattgg 


ccattagcca 


tattattcat tggttatata gcataaatca atattggcta 


60 


ttggccattg 


catacgttgt 


atctatatca taatatgtac atttatattg gctcatgtcc 


120 


aatatgaccg 


ccatgttggc 


attgattatt gactagttat taatagtaat caattacggg 


180 


gtcattagtt 


catagcccat 


atatggagtt ccgcgttaca taacttacgg taaatggccc 


240 


gcctggctga 


ccgcccaacg 


acccccgccc attgacgtca ataatgacgt atgttcccat 


300 


agtaacgcca 


atagggactt 


tccattgacg tcaatgggtg gagtatttac ggtaaactgc 


360 


ccacttggca 


gtacatcaag 


tgtatcatat gccaagtccg ccccctattg acgtcaatga 


420 


cggtaaatgg 


cccgcctggc 


attatgccca gtacatgacc ttacgggact ttcctacttg 


480 


gcagtacatc 


tacgtattag 


tcatcgctat taccatggtg atgcggtttt ggcagtacac 


540 


caatgggcgt 


ggatagcggt 


ttgactcacg gggatttcca agtctccacc ccattgacgt 


600 


caatgggagt 


ttgttttggc 


accaaaatca acgggacttt ccaaaatgtc gtaataaccc 


660 


cgccccgttg 


acgcaaatgg 


gcggtaggcg tgtacggtgg gaggtctata taagcagagc 


720 


tcgtttagtg 


aaccgtcaga 


tcactagaag ctttattgcg gtagtttatc acagttaaat 


780 


tgctaacgca 


gtcagtgctt 


ctgacacaac agtctcgaac ttaagctgca gaagttggtc 


840 


gtgaggcact 


gggcaggtaa 


gtatcaaggt tacaagacag gtttaaggag accaatagaa 


900 
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actgggcttg tcgagacaga gaagactctt: gcgtttctga taggcaccta ttggtcttac 960 

tgacatccac tttgcctttc tctccacagg tgtccactcc cagttcaatt acagctctta 1020 

aggctagagt acttaatacg actcactata ggctagcgga tccaccatgt tcatcttcct 1080 

gctgttcctg accctgacca gcggcagcga cctggaccgg tgcaccacct tcgacgacgt 1140 

gcaggccccc aactacaccc agcacaccag cagcatgcgg ggcgtgtact accccgacga 1200 

gatctttcgg agcgacaccc tgtacctgac ccaggacctg ttcctgccct tctacagcaa 1260 

cgtgaccggc ttccacacca tcaaccacac cttcggcaac cccgtgatcc ccttcaagga 1320 

cggcatctac ttcgccgcca ccgagaagag caacgtggtg cggggctggg tgttcggcag 1380 

caccatgaac aacaagagcc agagcgtgat catcatcaac aacagcacca acgtggtgat 1440 

ccgggcctgc aacttcgagc tgtgcgacaa ccccttcttc gccgtgtcca aacccatggg 1500 

cacccagacc cacaccatga tcttcgacaa cgccttcaac tgcaccttcg agtacatcag 1560 

cgacgccttc agcctggacg tgagcgagaa gagcggcaac ttcaagcacc tgcgggagtt 1620 

cgtgttcaag aacaaggacg gcttcctgta cgtgtacaag ggctaccagc ccatcgacgt 1680 

ggtgagagac ctgcccagcg gcttcaacac cctgaagccc atcttcaagc tgcccctggg 1740 

catcaacatc accaacttcc gggccatcct gaccgccttt agccctgccc aggacatctg 1800 

gggcaccagc gccgccgcct acttcgtggg ctacctgaag cctaccacct tcatgctgaa 1860 

gtacgacgag aacggcacca tcaccgacgc cgtggactgc agccagaacc ccctggccga 1920 

gctgaagtgc agcgtgaaga gcttcgagat cgacaagggc atctaccaga ccagcaactt 1980 

cagagtggtg cctagcggcg atgtggtgcg gttccccaat atcaccaacc tgtgcccctt 2040 

cggcgaagtg ttcaacgcca ccaagttccc cagcgtgtac gcctgggagc ggaagaagat 2100 

cagcaactgc gtggccgact acagcgtgcn gtacaactcc accttcttca gcaccttcaa 2160 

gtgctacggc gtgagcgcca ccaagctgaa cgacctgtgc ttcagcaacg tgtacgccga 2220 

cagcttcgtg gtgaagggcg acgacgtgag acagatcgcc cctggccaga ccggcgtgat 2280 

cgccgactac aactacaagc tgcccgacga cttcatgggc tgcgtgctgg cctggaacac 2340 

ccggaacatc gacgccacaa gcaccggcaa ctacaattac aagtaccgct acctgcggca 2400 

cggcaagctg cggcccttcg agcgggacan ctccaacgtg cccttcagcc ccgacggcaa 2460 

gccctgcacc ccccctgccc tgaactgcta ctggcccctg aacgactacg gcttctacac 2520 
caccaccggc atcggctatc agccctacag agtggtggtg ctgagcttcg agctgctgaa 2580 
cgcccctgcc accgtgtgcg gccccaagct gagcaccgac ctgatcaaga accagtgcgt 2640 
gaacttcaac ttcaacggcc tgaccggcac cggcgtgctg acccccagca gcaagcgctt 2700 
ccagcccttc cagcagttcg gccgggatgt gagcgacttc accgacagcg tgcgggaccc 2760 
caagaccagc gagatcctgg acatcagccc ctgcagcttc ggcggcgtgt ccgtgatcac 2820 
ccccggcacc aacgccagca gcgaagtggc cgtgctgtac caggacgtga actgcaccga 2880 
cgtgagcacc gccatccacg ccgaccagct gacccccgcc tggcggatct acagcaccgg 2940 
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gaacaacgtg 


ttccagaccc 


aggccggctg 


S226CAS111. 
cctgatcggc 


ST25 

gccgagcacg 


tggacaccag 


3000 


ctacgagtgc 


gacatcccca 


titggcgccgg 


aatctgcgcc 


agctaccaca 


ccgtgagcct 


3060 


gctgcggagc 


accagccaga 


agtccatcgt 


ggcctacacc 


atgagcctgg 


gcgccgacag 


3120 


cagcatcgcc 


tacagcaaca 


acaccatcgc 


catccccacc 


aacttcagca 


tctccatcac 


3180 


caccgaagtg 


atgcccgtga 


gcatggccaa 


gacaagcgtg 


gattgcaaca 


tgtacatctg 


3240 


cggcgacagc 


accgagtgcg 


ccaacctgct 


gctgcagtac 


ggcagcttct 


gcacccagct 


3300 


gaaccgggcc 


ctgagcggca 


tcgccgccga 


gcaggaccgg 


aacaccagag 


aagtgttcgc 


3360 


ccaagtgaag 


cagatgtata 


agacccccac 


cctgaagtac 


ttcgggggct 


tcaacttctc 


3420 


tcagatcctg 


cccgaccctc 


ugaagcccac 


caagcgctcc 


ttcatcgagg 


acctgctgtt 


3480 


caacaaagtg 


accctggccg 


acgccggctt 


tatgaagcag 


tacggcgagt 


gcctgggcga 


3540 


catcaacgcc 


cgggacctga 


tctgcgccca 


gaagtttaac 


gggctgaccg 


tgctgccccc 


3600 


cctgctgacc 


gacgacatga 


tcgccgccta 


tacagccgcc 


ctggtgagcg 


gcaccgccac 


3660 


cgccggctgg 


accttcggag 


ccggagccgc 


cctgcagatc 


cccttcgcca 


tgcagatggc 


3720 


ctaccggttc 


aacggcatcg 


gcgtgaccca 


gaacgtgctg 


tacgagaacc 


agaagcagat 


3780 


cgccaaccag 


ttcaacaagg 


ccatcagcca 


gatccaggag 


agcctgacca 


caaccagcac 


3840 


cgccctgggc aagctgcagg 


acgtggtgaa 


ccagaacgcc 


caggccctga 


acaccctggt 


3900 


gaagcagctg 


agcagcaact 


tcggcgccat 


cagctctgtg 


ctgaacgaca 


tcctgagcag 


3960 


gctggacaaa gtggaggccg 


aagtgcagat 


cgaccggctg 


atcaccggac 


gcctgcagtc 


4020 


cctgcagacc tacgtgaccc 


agcagctgat 


cagagccgcc 


gagatccggg 


ccagcgccaa 


4080 


tctggccgcc accaagatga 


gcgagtgcgt 


gctgggccag 


agcaagagag 


tggacttctg 


4140 


cggcaagggc tatcacctga 


tgagcttccc 


ccaggccgcc 


ccccacggcg 


tggtgttcct 


4200 


gcacgtgacc tacgtgccta 


gccaggagcg 


gaacttcacc 


accgccccag 


ccatctgcca 


4260 


cgagggcaag 


gcctacttcc 


cccgggaggg 


cgtgttcgtg 


tttaacggca 


ccagctggtt 


4320 


catcacccag 


cgcaacttct 


-tcagccccca 


gatcatcacc 


acagacaaca 


ccttcgtgtc 


4380 


cggcaactgt gatgtggtga 


■tcggcatcat 


caataacacc jgtgtacgacc 


ccctgcagcc 


4440 


cgagctggac agcttcaagg 


aggagctgga 


caaatacttc 


aagaaccaca 


cctcccccga 


4500 


cgtggacctg 


ggcgatatca 


gcggcatcaa 


cgcctccgtg 


gtgaacatcc 


agaaggagat 


4560 


cgacagactg 


aacgaagtgg 


ccaagaacct 


gaacgagagc 


ctgatcgacc 


tgcaggagct 


4620 


gggcaagtac 


gagcagtaca 


tcaagtggcc 


ctggtacgtg 


tggctgggct 


tcatcgccgg 


4680 


cctgatcgcc atcgtgatgg 


tgaccatcct 


gctgtgctgc 


atgaccagct 


gctgtagctg 


4740 


cctgaaaggc gcctgcagct 


gtggcagctg 


ctgcaagttc 


gacgaggacg 


acagcgagcc 


4800 


cgtgctgaag 


ggcgtgaagc 


tgcactacac 


ctgataactc 


gagaattcac 


gcgtggtacc 


4860 


tctagagtcg 


acccgggcgg 


ccgcttcgag 


cagacatgat 


aagatacatt 


gatgagtttg 


4920 


gacaaaccac 


aactagaatg 


cagtgaaaaa 


aatgctttat 


ttgtgaaatt 


tgtgatgcta 


4980 
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ttgctttatt 


tgtaaccatt 


ataagctgca 


S226CAS111.ST25 
ataaacaagt taacaacaac 


aattgcattc 


5040 


attttatgtt 


tcaggttcag 


ggggagatgt 


gggaggtttt 


ttaaagcaag 


taaaacctct 


5100 


acaaatgtgg 


taaaatcgat 


aaggatccgg 


gctggcgtaa 


tagcgaagag 


gcccgcaccg 


5160 


atcgcccttc 


ccaacagttg 


cgcagcctga 


atggcgaatg 


gacgcgccct 


gtagcggcgc 


5220 


attaagcgcg 


gcgggtgtgg 


tggttacgcg 


cagcgtgacc 


gctacacttg 


ccagcgccct 


5280 


agcgcccgct 


cctttcgctt 


tcttcccttc 


ctttctcgcc 


acgttcgccg 


gctttccccg 


5340 


tcaagctcta 


aatcgggggc 


tccctttagg 


gttccgattt 


agagctttac 


ggcacctcga 


5400 


ccgcaaaaaa 


cttgatttgg 


gtgatggttc 


acgtagtggg 


ccatcgccct 


gatagacggt 


5460 


ttttcgccct 


ttgacgttgg 


agtccacgtt 


ctttaatagt 


ggactcttgt 


tccaaactgg 


5520 


aacaacactc 


aaccctatct 


cggtctattc 


ttttgattta 


taagggattt 


tgccgatttc 


5580 


ggcctattgg 


ttaaaaaatg 


agctgattta 


acaaatattt 


aacgcgaatt 


ttaacaaaat 


5640 


attaacgttt 


acaatttcgc 


ctgatgcggt 


attttctcct 


tacgcatctg 


tgcggtattt 


5700 


cacaccgcat 


atggtgcact 


ctcagtacaa 


tctgctctga 


tgccgcatag 


ttaagccagc 


5760 


cccgacaccc 


gccaacaccc 


gctgacgcgc 


cctgacgggc 


ttgtctgctc 


ccggcatccg 


5820 


cttacagaca 


agctgtgacc 


gtctccggga 


gctgcatgtg 


tcagaggttt 


tcaccgtcat 


5880 


caccgaaacg 


cgcgagacga 


aagggcctcg 


tgatacgcct 


atttttatag 


gttaatgtca 


5940 


tgataataat 


ggtttcttag 


acgtcaggtg 


gcacttttcg 


gggaaatgtg 


cgcggaaccc 


6000 


ctatttgttt 


atttttctaa 


atacattcaa 


atatgtatcc 


gctcatgaga 


caataaccct 


6060 


gataaatgct 


tcaataatat 


tgaaaaagga 


agagtatgag 


tattcaacat 


ttccgtgtcg 


6120 


cccttattcc 


cttttttgcg 


gcattttgcc 


ttcctgtttt 


tgctcaccca 


gaaacgctgg 


6180 


tgaaagtaaa 


agatgctgaa 


gatcagttgg 


gtgcacgagt 


gggttacatc 


gaactggatc 


6240 


tcaacagcgg 


taagatcctt 


gagagttttc 


gccccgaaga 


acgttttcca 


atgatgagca 


6300 


cttttaaagt 


tctgctatgt 


ggcgcggtat 


tatcccgtat 


tgacgccggg 


caagagcaac 


6360 


tcggtcgccg 


catacactat 


tctcagaatg 


acttggttga 


gtactcacca 


gtcacagaaa 


6420 


agcatcttac 


ggatggcatg 


acagtaagag 


aattatgcag 


tgctgccata 


accatgagtg 


6480 


ataacactgc 


ggccaactta 


cttctgacaa 


cgatcggagg 


accgaaggag 


ctaaccgctt 


6540 


ttttgcacaa 


catgggggat 


catgtaactc 


gccttgatcg 


ttgggaaccg 


gagctgaatg 


6600 


aagccatacc 


aaacgacgag 


cgtgacacca 


cgatgcctgt 


agcaatggca 


acaacgttgc 


6660 


gcaaactatt 


aactggcgaa 


ctacttactc 


tagcttcccg 


gcaacaatta 


atagactgga 


6720 


tggaggcgga 


taaagttgca 


ggaccacttc 


tgcgctcggc 


ccttccggct 


ggctggttta 


6780 


ttgctgataa 


atictggagcc 


ggtgagcgtg 


ggtctcgcgg 


tatcattgca 


gcactggggc 


6840 


cagatggtaa 


gccctcccgt 


atcgtagtta 


tctacacgac 


ggggagtcag 


gcaactatgg 


6900 


atgaacgaaa 


tagacagatc 


gctgagatag 


gtgcctcact 


gattaagcat 


tggtaactgt 


6960 


cagaccaagt 


ttactcatat 


atactttaga 


ttgatttaaa 


acttcatttt 


taatttaaaa 


7020 
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ggatctaggt 


gaagatcctt 


tttgataatc 


S226CAS1U.ST25 
tcatgaccaa aatcccttaa 


cgtgagtttt 


7080 


cgttccactg 


agcgtcagac 


cccgtagaaa 


agatcaaagg 


atcttcttga 


gatccttttt 


7140 


ttctgcgcgt 


aatctgctgc 


ttgcaaacaa 


aaaaaccacc 


gctaccagcg 


gtggtttgtt 


7200 


tgccggatca 


agagctacca 


actctttttc 


cgaaggtaac 


tggcttcagc 


agagcgcaga 


7260 


taccaaatac 


tgtccttcta 


gtgtagccgt 


agttaggcca 


ccacttcaag 


aactctgtag 


7320 


caccgcctac 


atacctcgct 


ctgctaatcc 


tgttaccagt 


ggctgctgcc 


agtggcgata 


7380 


agtcgtgtct 


taccgggttg 


gactcaagac 


gatagttacc 


ggataaggcg 


cagcggtcgg 


7440 


gctgaacggg 


gggttcgtgc 


acacagccca 


gcttggagcg 


aacgacctac 


accgaactga 


7500 


gatacctaca 


gcgtgagcta 


tgagaaagcg 


ccacgcttcc 


cgaagggaga 


aaggcggaca 


7560 


ggtatccggt 


aagcggcagg 


gtcggaacag 


gagagcgcac 


gagggagctt 


ccagggggaa 


7620 


acgcctggta 


tctttatagt 


cctgtcgggt 


ttcgccacct 


ctgacttgag 


cgtcgatttt 


7680 


tgtgatgctc 


gtcagggggg 


cggagcctat 


ggaaaaacgc 


cagcaacgcg 


gcctttttac 


7740 


ggttcctggc 


cttttgctgg 


ccttttgctc 


acatggctcg 


acagatct 




7788 



<210> 141 

<211> 23 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce SNE-Sl 

<400> 141 

ggttgggatt atccaaaatg tga 23 

<210> 142 

<211> 24 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce SNE-ASl 
<400> 142 

gcatcatcag aaagaatcat catg 

<210> 143 
<211> 21 
<212> DNA 
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<213> Artificial sequence 



<220> 

<223> amorce SARl-s 

<40O> 143 

cctctcttgt tcttgctcgc a 21 

<210> 144 

<211> 21 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce SARl-AS 

<40O> 144 

tatagtgagc cgccacacat g 21 

<210> 145 

<211> 45 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce PCR 

<40O> 145 

ataggatcca ccatgtttat tttcttatta tttcttactc tcact 45 

<210> 146 

<211> 37 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> amorce PCR 
<40O> 146 

atactcgagt tatgtgtaat gtaatttgac acccttg 37 



<210> 147 
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<211> 45 
<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce PCR 
<40O> 147 

ataggatcca ccatgtttat tttcttatta tttcttactc tcact 45 

<210> 148 

<211> 36 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce PCR 

<40O> 148 

acctccggat ttaatatatt gctcatattt tcccaa 36 

<210> 149 

<211> 13 

<212> PRT 

<213> Artificial sequence 
<220> 

<223> extremite N-terminale de la proteine s du SRAS-CoV (acides amines 
1 a 13) 

<40O> 149 

Met Phe He Phe Leu Leu Phe Leu Thr Leu Thr ser Gly 
15 10 

<210> 150 
<211> 10 
<212> PRT 

<213> Artificial sequence 
<220> 
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<223> ol i gopepti de 
<400> 150 

ser Gly Asp Tyr Lys Asp Asp Asp Asp Lys 
1 5 10 

<210> 151 

<211> 34 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce PCR 

<400> 151 

actagctagc ggatccacca tgttcatctt cctg 34 

<210> 152 

<211> 33 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce PCR 

<400> 152 

agtatccgga cttgatgtac tgctcgtact tgc 33 

<210> 153 

<211> 59 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> ol i gonucl eoti de 

<400> 153 

tatgagcttt tttttttttt tttttttggc atataaatag actcggcgcg ccatctgca 59 

<210> 154 
<211> 53 
<212> DNA 
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<213> Artificial sequence 



<220> 

<223> ol i gonucl eoti de 

<400> 154 

gatggcgcgc cgagtctatt tatatgccaa aaaaaaaaaa aaaaaaaagc tea 53 

<210> 155 

<2U> 45 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce PCR 

<400> 155 

ataegtaega ccatgtttat tttcttatta tttcttactc tcact 45 

<210> 156 

<211> 40 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce PCR 

<400> 156 

atagegeget cattatgtgt aatgtaattt gacacccttg 40 

<210> 157 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce PCR 

<400> 157 

ccatttcaac aatttggccg 20 



<210> 158 
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<211> 45 
<212> DNA 

<213> Artificial sequence 
<220> 

<223> amorce PCR 
<400> 158 

ataggatccg cgcgctcatt atttatcgtc gtcatcttta taatc 45 



Page 142 



n* I l—i um i ivsivm. ivi ■ ■ ■ i \s ■ ■ ■ 



International Application No 

PCT/FR2004/003105 



A. CLASSIFICATION OF SUBJECT MATTER 

IPC 7 C12N7/00 C07K14/165 



G01N33/569 



According to International Patent Classification (IPC) or to both national classification and IPC 



B. FIELDS SEARCHED 



Minimum documentation searched (classification system followed by classification symbols) 

IPC 7 C12N C07K G01N 



Documentation searched other than minimum documentation to the extent that such documents are included in the fields searched 



Electronic data base consulted during the international search (name of data base and, where practical, search terms used) 

EPO-Internal, WPI Data, PAJ, EMBASE, BIOSIS, Sequence Search 



C. DOCUMENTS CONSIDERED TO BE RELEVANT 



Category • Citation of document, with indication, where appropriate, of the relevant passages 



Relevant to claim No 



DATABASE UNIPROT 

10 October 2003 (2003-10-10), 

XP002294755 

Database accession no. P59594 
the whole document 



MARRA MA ET AL: "The genome sequence of 
the SARS-assodated coronavlrus" 
SCIENCE, AMERICAN ASSOCIATION FOR THE 
ADVANCEMENT OF SCIENCE,, US, 
vol. 300, no. 5624, 

30 May 2003 (2003-05-30), pages 1399-1404, 
XP002269483 
ISSN: 0036-8075 
the whole document 

-/-- 



I- 5,7,8, 

II- 31 



I- 5,7,8, 

II- 31 



m 



Further documents are listed in the continuation of box C 



□ 



Patent family members are listed in annex. 



° Special categories of cited documents 

"A" document defining the general state of the art which is not 
considered to be of particular relevance 

*E a earlier document but published on or after the international 
filing date 

*L* document which may throw doubts on pnonty claim(s) or 
which is cited to establish the publication date of another 
citation or other special reason (as specified) 

a O* document referring to an oral disclosure, use, exhibition or 
other means 

•P" document published prior to the international filing date but 
later than the pnonty date claimed 



■T later document published after the international filing date 
or pnonty date and not in conflict with the application but 
cited to understand the principle or theory underlying the 
invention 

•X' document of particular relevance, the claimed invention 
cannot be considered novel or cannot be considered to 
involve an inventive step when the document is taken alone 

■V document of particular relevance, the claimed invention 

cannot be considered to involve an inventive step when the 
document is combined with one or more other such docu- 
ments, such combination being obvious to a person skilled 
in the art 

a &* document member of the same patent family 



Date of the actual completion of the international search 



10 May 2005 



Date of mailing of the international search report 



06/06/2005 



Name and mailing address of the ISA 

European Patent Office. P B 5818 Patentlaan 2 
NL - 2280 HV Ryswijk 
Tel. (+31-70) 340-2040, Tx 31 651 epo nl, 
Fax (+31-70)340-3016 



Authonzed officer 



Chavanne, F 



Form PCT/ISA/210 (second sheet) (January 2004) 



INTERNATIONAL SEARCH REPORT 



International Application No 

PCT/FR2004/003105 



C.(Continuatlon) DOCUMENTS CONSIDERED TO BE RELEVANT 



Category • Citation of document, with indication, where appropriate, ot the relevant passages 



Relevant to claim No. 



WANG J ET AL: "ASSESSMENT OF 
IMMUNOREACTIVE SYNTHETIC PEPTIDES FROM THE 
STRUCTURAL PROTEINS OF SEVERE ACUTE 
RESPIRATORY SYNDROME CORONAVIRUS" 
CLINICAL CHEMISTRY, AMERICAN ASSOCIATION 
FOR CLINICAL CHEMISTRY. WINSTON, US, 
vol. 49, no. 12, 

13 November 2003 (2003-11-13), pages 
1989-1996, XP001182489 
ISSN: 0009-9147 
the whole document 



1-31 



Form PCT/ISA/210 (continuation of second sheet) (Januaiy 200 A) 



Demande Internationale No 

PCT/FR2004/003105 



A, CLASSEMENT DE L'OBJET DE LA DEMANDE , 

CIB 7 C12N7/00 C07K14/165 G01N33/569 



Sejon la classification Internationale des brevets (CIB) ou a la fots sejon la classification nalionate et la CIB 



B. DOM A IN ES SUR LESQUELS LA RECHERCHE A PORTE 



Documentation mtnimale consultee (systeme de classification suivi des symboles de classement) 

CIB 7 C12N C07K G01N 



Documentation consultee autre que la documentation minimale dans la mesare ou ces documents relevent des domames sur lesquels a porte la recherche 



Base de donnees electromque consultee au cours de la recherche Internationale (nom de la base de donnees, et si realisable, termes de recherche utilises) 

EPO-Internal , WPI Data, PAJ, EMBASE, BIOSIS, Sequence Search 



C. DOCUMENTS CONSIDERES COMME PERTINENTS 



Categorte 



Identification des documents cites, avec, le cas echeant. Tindication des passages pertinents 



no des revendications visees 



DATABASE UNIPROT 

10 OCtObre 2003 (2003-10-10), 

XP002294755 

Database accession no. P59594 
le document en entler 



MARRA M A ET AL: "The genome sequence of 
the SARS-associated coronavlrus" 
SCIENCE, AMERICAN ASSOCIATION FOR THE 
ADVANCEMENT OF SCIENCE,, US, 
vol . 300, no. 5624, 

30 ma1 2003 (2003-05-30), pages 1399-1404, 

XP002269483 

ISSN: 0036-8075 

le document en entier 

-/-- 



I- 5,7,8, 

II- 31 



I- 5,7,8, 

II- 31 



[ )( j Voir la suite du cadre C pour la fin de la liste des documents 



□ 



Les documents de families de brevets sont mdiques en annexe 



° Categories speciales de documents cites. 

'A' document defimssant Petat general de la technique, non 
considere comma parltculierement pertinent 

a E* document anteneur, mais pubtte a la date de depot international 
ou apres cette date 

'L' document pouvanl jeter un doute sur une revendication de 
pnonle ou cite pour determiner la date de publication d'une 
autre citation ou pour une raison speciale (telle qu'indiquee) 

'O' document se referant a une divulgation orale, a un usage, a 
une exposition ou tous autres moyens 

'P" document publie avant la date de depot International, mais 
posteneurement a la date de pnonte revendiquee 



*T document ulterieur publie apres la date de depot international ou la 
date de pnorite et n'appartenenant pas a I'etat de la 
technique pertinent, mats cite pour comprendre le pnnctpe 
ou la theone const rt uant la base de f invent ion 

"X* document particutierement pertinent, fmven tion revendiquee ne peut 
etre consideree com me nouvelle ou comme tmpliquant une acirvtte 
inventive par rapport au document considere isolement 

*Y* document particuheremenl pertinent, I'mven tion revendiquee 

ne peut etre consideree comme impliquant une activite inventive 
lorsque le document est assooe a un ou plusteurs autres 
documents de meme nature, cette combmaison etant evidente 
pour une person ne du metier 
document qui fait partie de la meme famille de brevets 



Date a laquelle la recherche Internationale a ete effectrvement achevee 



10 ma1 2005 



Dale d'expedrtion du present rapport de recherche Internationale 



06/06/2005 



Nom et adresse postale de I'administration chargee de la recherche Internationale 
Office European des Brevets, P.B 581 8 Patentlaan 2 
NL - 2280 HV Ri|SWl|k 
Tel (+31-70) 340-2040, Tx 31 651 epo nl. 
Fax (+31-70)340-3016 



Fonctionnaire autorlse 



Chavanne, F 



Formulate PCT/lSA/210 (deuxi^ne feuille) (Janvier 2004) 



nMrrv-rm uc ncuncnv/nc mm i tnnn i ivii^ll 



Demande Internationale No 

PCT/FR2004/003105 



C(suite) DOCUMENTS CONSIDERES COMME PERTINENTS 



Categorie 0 


Identification des documents cites, avec, le cas echeant, I'indlcatlon des passages pertinents 


no des revendications vis6es 


X 


WANG J ET AL: "ASSESSMENT OF 
IMMUNOREACTIVE SYNTHETIC PEPTIDES FROM THE 
STRUCTURAL PROTEINS OF SEVERE ACUTE 
RESPIRATORY SYNDROME CORONAVIRUS" 
CLINICAL CHEMISTRY, AMERICAN ASSOCIATION 
FOR CLINICAL CHEMISTRY. WINSTON, US_, 
vol . 49, no. 12, 

13 novembre 2003 (2003-11-13), pages 

1989-1996, XPOOl 182489 

ISSN: 0009-9147 

le document en entier 


1-31 



CAwniaim DrtT/iQA/CMn feint* rto la riAMviAma re.tiiil«1 f.lanvifir ?004\ 



